
Google выпустила Gemini 3.5 Flash
На Google I/O представили Gemini 3.5 Flash. Модель обошла Gemini 3.1 Pro на большинстве бенчмарков и при этом работает в 4 раза быстрее других флагманских моделей.

По конкретным цифрам. Finance Agent v2, тест на анализ финансовых данных, 57.9% — лучший результат среди всех сравниваемых моделей. Мультимодальное понимание MMMU-Pro — 83.6%. Анализ сложных графиков CharXiv Reasoning — 84.2%. В агентных задачах GDPval-AA Elo вырос с 1314 до 1656 по сравнению с 3.1 Pro. Работа с инструментами MCP Atlas — с 78.2% до 83.6%.
Слабее конкурентов Flash выглядит в двух местах. Terminal-bench, агентное кодирование в терминале, GPT-5.5 здесь на первом месте с 78.2%. SWE-Bench Pro, реальные задачи по разработке, лидирует Claude Opus 4.7 с 64.3%.

В AI-кодировании один запрос не решает задачу, модель читает файлы, вносит правки, запускает тесты, исправляет ошибки снова. При скорости в 4 раза выше за то же время можно сделать в 4 раза больше итераций.
Gemini 3.5 встроят в поиск Google. Прямо в поисковой строке можно будет вести диалог с ИИ, загружать файлы для анализа, создавать агентов под конкретные задачи и делегировать рутину: поиск товаров, сравнение цен на отели, мониторинг новостей, не переключаясь между вкладками.
Ежедневные подборки промптов, свежие новости и материалы об ИИ — там, где удобно. Без спама, только редакционный отбор.