Google выпустила Gemini 3.5 Flash

Google выпустила Gemini 3.5 Flash

На Google I/O представили Gemini 3.5 Flash. Модель обошла Gemini 3.1 Pro на большинстве бенчмарков и при этом работает в 4 раза быстрее других флагманских моделей.

По конкретным цифрам. Finance Agent v2, тест на анализ финансовых данных, 57.9% — лучший результат среди всех сравниваемых моделей. Мультимодальное понимание MMMU-Pro — 83.6%. Анализ сложных графиков CharXiv Reasoning — 84.2%. В агентных задачах GDPval-AA Elo вырос с 1314 до 1656 по сравнению с 3.1 Pro. Работа с инструментами MCP Atlas — с 78.2% до 83.6%.

Слабее конкурентов Flash выглядит в двух местах. Terminal-bench, агентное кодирование в терминале, GPT-5.5 здесь на первом месте с 78.2%. SWE-Bench Pro, реальные задачи по разработке, лидирует Claude Opus 4.7 с 64.3%.

В AI-кодировании один запрос не решает задачу, модель читает файлы, вносит правки, запускает тесты, исправляет ошибки снова. При скорости в 4 раза выше за то же время можно сделать в 4 раза больше итераций.

Gemini 3.5 встроят в поиск Google. Прямо в поисковой строке можно будет вести диалог с ИИ, загружать файлы для анализа, создавать агентов под конкретные задачи и делегировать рутину: поиск товаров, сравнение цен на отели, мониторинг новостей, не переключаясь между вкладками.

Google выпустила Gemini 3.5 Flash

Подпишись,чтобыничего непропустить

читайтедальше

Lucy 2.5 умеет менять видео в реальном времени

StackBlitz выпустила Bolt Slides, презентации, которые работают как полноценные веб-приложения

Google окончательно объединяет Gemini и NotebookLM

Подпишись,
чтобы
ничего не
пропустить

читайте
дальше