«Яндекс» показал прототип собственной нейросети для генерации картинок

05.04.2023 Ольга Волкова 0 Комментариев

«Яндекс» представил прототип собственной нейросети для генерации картинок по текстовым запросам пользователей, сообщила компания. Протестировать ее работу можно в бета-версии 0.1.4 приложения «Шедеврум», которое доступно на Android и iOS.

«Яндекс» показал прототип собственной нейросети для генерации картинок Анастасия Марьина

«Шедеврум» распознает русский и английский языки и лучше всего реагирует на конкретные запросы.

Нейросеть также учитывает особые пожелания (например, «фотореализм» или «высокая детализация»), может подражать известным живописцам и работать в заданных художественных стилях.

Нейросеть «Шедеврума» создает изображения по методу каскадной диффузии: сначала формирует картинки в соответствии с запросом, после чего поэтапно увеличивает их разрешение и насыщает деталями.

Первую версию генеративной модели обучили на 240 млн примеров картинок с текстовыми описаниями. В настоящее время обучение продолжается на наборе данных из 500 млн примеров, и уже в следующих обновлениях «Яндекс» обещает улучшить качество.

Чтобы генерировать картинки по собственным запросам, необходимо оставить заявку и дождаться ее подтверждения. Позднее такую возможность получат все зарегистрированные пользователи.

По словам руководителя управления машинного интеллекта и исследований «Яндекса» Алексея Гусакова, к моменту финального релиза нейросеть сможет генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин.

Над созданием нейросети для генерации изображений по текстовому описанию также работает «Сбер». Накануне компания представила третье обновление своей модели Kandinsky, которая была обучена на 1 млрд пар «текст — изображение» и создает изображения за несколько секунд.

Источник