
Meituan выложила в открытый доступ фреймворк для создания цифровых людей
Команда LongCat из Meituan опубликовала LongCat-Video-Avatar 1.5, открытый фреймворк для генерации цифровых аватаров. В новой версии скорость генерации выросла за счёт 8-шагового инференса, а аудиоэнкодер заменили на Whisper-Large, что убрало проблему рассинхронизации губ со звуком.
По качеству и стабильности результата фреймворк конкурирует с платными коммерческими решениями. Работает не только с реалистичными людьми, но и с аниме-персонажами и животными.
Раньше такой инструмент был доступен только в виде платных сервисов. Теперь его можно запустить самостоятельно, что заметно снижает порог входа для авторов, которые хотят делать виртуальных аватаров для своих проектов.
Ежедневные подборки промптов, свежие новости и материалы об ИИ — там, где удобно. Без спама, только редакционный отбор.