itkvariat

Google собирается отнять у ChatGPT корону лидера в создании видео с помощью ИИ



Битва за ИИ между Google и OpenAI (команда, стоящая за ChatGPT) накаляется, и обе компании выпускают новые продукты, функции и обновления в этом месяце. Теперь Google DeepMind, исследовательская лаборатория Google в области ИИ, нацелилась на победу над OpenAI в игре по созданию видео — и, возможно, ей это удастся, по крайней мере, на какое-то время.

DeepMind представила Veo 2, ИИ-генератор видео следующего поколения и преемника Veo, который поддерживает различные продукты в линейке Google. Veo 2 может создавать клипы длительностью более двух минут с разрешением до 4K (4096 x 2160 пикселей). Это в четыре раза больше разрешения и в шесть раз больше продолжительности Sora от OpenAI, который совсем недавно стал доступен пользователям.

Однако это преимущество все еще теоретическое. В экспериментальном видеоинструменте Google VideoFX, где Veo 2 в настоящее время является эксклюзивом, видео ограничены разрешением 720p и длиной всего восемь секунд. (Sora, с другой стороны, может создавать 20-секундные видео с разрешением 1080p.)

В настоящее время VideoFX находится в списке ожидания, но Google увеличивает число пользователей, которые могут получить к нему доступ на этой неделе. Компания планирует внедрить его в большее количество своих продуктов, включая YouTube Shorts, в следующем году. Подобно оригинальному Veo, Veo 2 может создавать видео из простого текстового запроса или комбинации текста и опорного изображения.


Итак, чем отличается Veo 2? DeepMind утверждает, что эта новая модель лучше «понимает» физику и элементы управления камерой, что приводит к «более четким» кадрам. Под «более четкими» они подразумевают более четкие текстуры и изображения, особенно в сценах с действием.

Что касается элементов управления камерой, Veo 2 теперь может точнее позиционировать виртуальную камеру и перемещать ее, чтобы снимать людей и объекты с разных ракурсов.

Он также может имитировать различные объективы и кинематографические эффекты, придавая видео более отточенный, похожий на кино. Кроме того, говорят, что он улавливает более тонкие человеческие выражения. DeepMind поделился несколькими тщательно отобранными образцами, и я думаю, что они выглядят довольно впечатляюще для кадров, созданных с помощью ИИ.

Тем не менее, еще предстоит проделать некоторую работу. Взгляните на странно скользкую дорогу на кадрах выше или на пешеходов на заднем плане, сливающихся вместе. Итак, для тех, кто беспокоится, что ИИ может взять верх, он добился огромных успехов, но ему все еще далеко до замены человеческих знаний и навыков.

Veo 2 обучался на куче видео, что довольно стандартно для моделей ИИ. Получая бесчисленные примеры данных, эти модели начинают распознавать закономерности, которые позволяют им генерировать новый контент. Хотя DeepMind не раскрывает точные источники видео, используемых для обучения Veo 2, YouTube является вероятным кандидатом, учитывая, что он принадлежит Google.

Как и другие модели изображений и видео Google, Veo 2 встраивает невидимый водяной знак SynthID в свои выходные данные, чтобы пометить их как сгенерированные ИИ, что призвано помочь предотвратить дезинформацию и неправильную атрибуцию. Но давайте будем реалистами — большинство людей, вероятно, не проверяют наличие водяного знака перед тем, как поделиться видео, что все еще оставляет место для распространения дезинформации.

Наряду с Veo 2, Google DeepMind также представила обновления Imagen 3, своей модели генерации изображений. Новая версия Imagen 3 теперь доступна пользователям ImageFX, инструмента создания изображений Google, начиная с этого понедельника. Обновленная модель обещает предоставлять «более яркие, лучше скомпонованные» изображения и фотографии в различных стилях, включая фотореализм, импрессионизм и аниме.


Иван Ковалев

VIA



Подписывайтесь и читайте новости от ITквариат раньше остальных в нашем Telegram-канале !





Заметили ошибку? Выделите ее мышкой и нажмите Ctrl+Enter!  




И еще на эту тему...
  • Создатель ChatGPT близок к разработке собственного чипа для ИИ
  • ByteDance уволила стажера после саботажа обучения ее ИИ
  • Встроенная поддержка ChatGPT в iOS 18.2 может делать больше, чем просто отвечать на вопросы
  • Из-за ограничений США ByteDance обучает новую модель ИИ для работы на чипах Huawei
  • TSMC готова выделить отдельные мощности для производства чипов OpenAI
  • OpenAI разрабатывает секретный проект "Strawberry", который поможет ChatGPT перехитрить людей
  • Apple планирует добавить Meta AI в iOS 18 для улучшения функций Apple Intelligence
  • Xiaomi выпустил на мировой рынок 12,1-дюймовый планшет Redmi Pad Pro
  • Nvidia покажет разработчикам свой новый AI-чип на следующей неделе
  • В Европе разгорается война за специалистов в области искусственного интеллекта
  • Google будет платить новостным сайтам за использование своего ИИ для написания статей
  • Компания Samsung всерьез собралась обойти Apple с устройствами для мониторинга здоровья
  • ИИ будет доминировать на выставке CES в этом году даже без участия Сэма Альтмана
  • Microsoft и OpenAI создают ИИ с уровнем человеческого ума
  • Ограничения США на экспорт чипов дают Huawei шанс вытеснить Nvidia с китайского рынка
  • Google готовит своего мощного конкурента GPT-4
  • Большинство американцев слышали о ChatGPT, но использовали его лишь немногие
  • Инженеры Microsoft используют ChatGPT для обучения роботов и дронов
  • ChatGPT прибавил за два месяца 100 миллионов пользователей и стал самым быстрорастущим «приложением» за всю историю
  • Google AlphaGo AI победил чемпиона мира по GO



  • ITквариат Powered by © 1996-2025 16+