
Google выпустила Gemini Omni: модель, которая понимает видео как человек
Gemini Omni — новая модель от Google, которая умеет создавать и редактировать видео, понимая при этом физику, историю, биологию и контекст происходящего на экране.
Главное отличие от других видеогенераторов, не просто красивая картинка, а логика внутри. Объекты ведут себя как в реальном мире, события влекут последствия, сюжет развивается без противоречий.
Персонаж задаётся один раз и остаётся собой в любой сцене, другое освещение, другая локация, другое действие, внешность не меняется.
Стиль, движение и эффекты применяются двумя способами: загрузить референс или описать словами в чате.
Отдельная функция, переработка уже готового видео. Можно взять съёмку со смартфона и попросить Gemini Omni изменить окружение, добавить объекты или полностью переосмыслить сцену.
Первая модель Gemini Omni Flash будет доступна всем уже сегодня.
Ежедневные подборки промптов, свежие новости и материалы об ИИ — там, где удобно. Без спама, только редакционный отбор.