Google выпустила Gemini Omni: модель, которая понимает видео как человек

Google выпустила Gemini Omni: модель, которая понимает видео как человек

Gemini Omni — новая модель от Google, которая умеет создавать и редактировать видео, понимая при этом физику, историю, биологию и контекст происходящего на экране.

Главное отличие от других видеогенераторов, не просто красивая картинка, а логика внутри. Объекты ведут себя как в реальном мире, события влекут последствия, сюжет развивается без противоречий.

Персонаж задаётся один раз и остаётся собой в любой сцене, другое освещение, другая локация, другое действие, внешность не меняется.

Стиль, движение и эффекты применяются двумя способами: загрузить референс или описать словами в чате.

Отдельная функция, переработка уже готового видео. Можно взять съёмку со смартфона и попросить Gemini Omni изменить окружение, добавить объекты или полностью переосмыслить сцену.

Первая модель Gemini Omni Flash будет доступна всем уже сегодня.