Это гибридная модель с "гибким" режимом ризонинга (размышлений).
Теперь модель сама решает, насколько глубоко нужно подумать, но в API можно задать лимит размышлений вручную — от 0 до 24 576 токенов! Чем больше лимит — тем умнее ответы. – Молниеносная скорость и низкая цена, как у старого Flash 2.0, но теперь с куда более продуманными ответами. По тестам: – На Hard Prompts в LMArena Gemini 2.5 Flash уверенно обходит Claude Sonnet 3.5, Sonnet 3.7 и R1. – На уровне o4-mini и Grok-3, но при этом существенно дешевле.
Цены просто ниже не бывают: – Инпут: $0.15 за миллион токенов – Аутпут: $0.6 за миллион токенов – С полным ризонингом — около $3.5 за миллион. На фоне конкурентов: – Sonnet 3.7 и R1 — уже не тянут по качеству. – Grok-3 и o4-mini выглядят чуть сильнее в тяжелых задачах, но по соотношению цена/качество Flash 2.5 явно лидер. Можно уже тестить через Google AI Studio, Vertex AI, в Gemini API и конечно в Gemini app через выбор моделей.