Google показала нейросеть, которая создает HD-видео по текстовому описанию

Отдел новостей
Доступа у простых пользователей к нейросети пока нет, но можно посмотреть на результат труда сложных алгоритмов.
Google показала нейросеть, которая создает HD-видео по текстовому описанию
Скриншот: imagen.research.google

Компания Google решила не отставать от моды и поработала над собственной нейросетью, способной создавать не просто статичные изображения, а полноценные видео. Алгоритмы объединены под общим названием Imagen Video. Для того чтобы получить нужный результат, достаточно сделать текстовое описание (сценарий). Это позволит нейросети "понять", что от нее требуется.

Разработчики пока не публикуют исходный код и ограничили доступ к алгоритмам, чтобы избежать появления в сети шокирующего и непристойного контента.

Как заявляют представители Imagen Video, нейросеть способна работать в разных стилях, делать 2D и 3D анимацию. Правда, есть и ограничение. Максимальная продолжительность ролика – 5 секунд в разрешении 1280х768 пикселей.

Для обучения Imagen Video понадобились десятки миллионов фотографий, видео и текстовых описаний.

Как это работает?

После предоставления текстового описания первичная система генерирует максимально упрощенный прототип видео. Оно состоит из 16 кадров с разрешением 24х48 пикселей с частотой обновления 3 кадра в секунду. После более сложная система поднимает разрешение до 1280 на 768 пикселей, увеличивает продолжительность ролика до 5 секунд и повышает частоту.

>>> Больше интересных новостей – подпишитесь на наш Telegram

Загрузка...

Нет больше страниц для загрузки

Нет больше страниц для загрузки