«Яндекс» показал прототип собственной нейросети для генерации картинок
«Яндекс» представил прототип собственной нейросети для генерации картинок по текстовым запросам пользователей, сообщила компания. Протестировать ее работу можно в бета-версии 0.1.4 приложения «Шедеврум», которое доступно на Android и iOS.
«Яндекс» показал прототип собственной нейросети для генерации картинок Анастасия Марьина
«Шедеврум» распознает русский и английский языки и лучше всего реагирует на конкретные запросы.
Нейросеть также учитывает особые пожелания (например, «фотореализм» или «высокая детализация»), может подражать известным живописцам и работать в заданных художественных стилях.
Нейросеть «Шедеврума» создает изображения по методу каскадной диффузии: сначала формирует картинки в соответствии с запросом, после чего поэтапно увеличивает их разрешение и насыщает деталями.
Первую версию генеративной модели обучили на 240 млн примеров картинок с текстовыми описаниями. В настоящее время обучение продолжается на наборе данных из 500 млн примеров, и уже в следующих обновлениях «Яндекс» обещает улучшить качество.
Чтобы генерировать картинки по собственным запросам, необходимо оставить заявку и дождаться ее подтверждения. Позднее такую возможность получат все зарегистрированные пользователи.
По словам руководителя управления машинного интеллекта и исследований «Яндекса» Алексея Гусакова, к моменту финального релиза нейросеть сможет генерировать баннеры, иллюстрации, создавать изображения для интернет-витрин.
Над созданием нейросети для генерации изображений по текстовому описанию также работает «Сбер». Накануне компания представила третье обновление своей модели Kandinsky, которая была обучена на 1 млрд пар «текст — изображение» и создает изображения за несколько секунд.
Пишу о технологиях, науке и кино!