Все обсуждают нейросеть DALL-E, которая рисует изображения по текстовым запросам. Ее зовут «убийцей художников» и прочат арт-революцию

В последние недели даже далекие от высоких технологий люди все чаще стали говорить о нейросети DALL-E 2, представленной в апреле 2022 года. Нейросеть «дорисовала» классические картины, превратив Мону Лизу в полноростовой портрет и добавив окружающий пейзаж на полотно Василия Верещагина «Апофеоз войны», а журнал Cosmopolitan и вовсе с ее помощью сгенерировал изображение для обложки номера. Журналисты и критики все чаще говорят о революции в искусстве, в результате которой машина может заменить человека в творчестве. Насколько такие опасения оправданы?

Что такое DALL-E?

DALL-E — нейросеть, которая буквально умеет «рисовать» все, что ее попросит пользователь. Свое имя она получила от слияния имен Сальвадора Дали и трогательного робота ВАЛЛ-И из одноименного мультика Pixar.

Разработали нейросеть в OpenAI. Это исследовательская компания, занимающаяся искусственным интеллектом (ИИ), которую основали Илон Маск и инвестор Сэм Альтман. Их целью было собрать команду разработчиков, которая бы работала на благо всего общества, а не какой-то отдельной компании или правительства. Этим они надеялись избежать концентрации возможностей ИИ в одних руках.

Первая версия DALL-E была представлена в январе 2021 года и уже тогда вызвала широкий интерес. Она умела генерировать небольшие изображения (256х256 пикселей) по тексту и наброску. В апреле 2022 года вышла новая версия алгоритма: DALL-E 2. Она способна генерировать картинки со значительно большим разрешением —1024х1024 пикселей. Кроме этого, она может еще и добавлять или убирать с изображений детали. Но самое главное, вторая версия смогла создавать намного более реалистичные изображения, нежели предшественница.

Как работает DALL-E?

Когда пользователь просит нейросеть что-то нарисовать, система DALL-E 2 выполняет три шага, объясняет Валерия Ефимова, научный сотрудник лаборатории Машинного обучения в Университете ИТМО. На первом этапе текст пользователя специальным образом кодируется в виде вектора чисел, на основе которого создается числовой вектор изображения. Из него на третьем этапе и «рождается» картинка.

«DALL-E 2 позволяет совместить несовместимое в реальности, — поясняет Валерия Ефимова, — например, портал в другую вселенную в миске супа. Такое возможно только в творчестве, но на подобную картину художник потратил бы несколько часов. А так за минуты, не обладая художественными способностями, можно сгенерировать что угодно, да еще и в нескольких вариантах. Выглядит потрясающе, во всяком случае, на первый взгляд. Все достигнуто за счет обучения на огромных массивах данных (253 миллиона пар картинка — текст) с использованием 1024 видеокарт в течение многих дней».

От Моны Лизы до Cosmopolitan

Сразу после выхода DALL-E 2 вызвал ажиотаж (еще больший, чем первая версия алгоритма). Не успела отгреметь новость о презентации, как в сети стали появляться все новые демонстрации возможностей нейросети-художника. Так, пользователям показали, как она может дорисовывать классические произведения, превратив с ее помощью «Мону Лизу» и «Девушку с жемчужной сережкой» в полноростовые портреты.

Также нейросеть тестировали на понимание чувства юмора, заставляя переосмыслять популярные мемы. Те, кто уже попробовал возможности новой DALL-E, выкладывают самые странные и креативные картинки в сеть (например, изображение, на котором Фредди Меркьюри ест рамен в стиральной машинке, а греческие философы играют в дженгу).

Громкой новостью стала обложка глянцевого журнала Cosmopolitan, полностью сгенерированная нейросетью от OpenAI. Она была создана командой во главе с цифровой художницей Карен X. Ченг. Авторы идеи перепробовали множество вариантов, пока не остановились на последнем, созданном по запросу «широкоугольный снимок с нижнего ракурса женщины-космонавта спортивного телосложения, развязно шагающей к камере по поверхности Марса в бесконечной вселенной». Полностью историю создания обложки можно прочитать на сайте издания, однако ждать ее печатной версии, видимо, пока не стоит — предполагается, что идея была лишь экспериментом.

От Malevich до Kandinsky

Испытать возможности DALL-E 2 могут не все (во всяком случае, пока). Пока доступ к ней есть лишь у ограниченного количества людей в тестовом режиме. «Я записалась в очередь еще в апреле, но так и не получила доступ», — сетует Валерия Ефимова из Университета ИТМО.

Зато российские пользователи могут попробовать русскоязычную версию, созданную Сбером на основе первого поколения DALL-E. Она также пережила эволюцию. В ноябре 2021 года был представлен reDALL-E Malevich, а в июне 2022 — обновленный вариант, получивший наименование Kandinsky (сейчас он доступен в приложении Сбера «Салют»).

Доступ к Malevich можно получить на сайте или через Telegram-бота. Он предлагает три варианта изображения по запросу пользователя. Впрочем, их качество далеко не всегда впечатляет. Kandinsky на основе слов пользователя создает 9 картинок малого разрешения. Из них уже можно выбрать понравившееся, чтобы нейросеть его детализировало. Сообщается, что новую версию ruDALL-E можно использовать для создания рекламных материалов, иллюстраций и дизайна в цифровом искусстве.

Общество будущего: цифровая душа, доверие вместо кредитной истории и победа над авторитаризмом

Спор о правах

Впечатляющие успехи нейросетей в "творчестве" вызывают не только восхищение, но и ряд вопросов. Некоторые из них лежат в юридической плоскости, в частности, кого именно считать автором и правообладателем картинок, полученных с помощью алгоритма, в особенности такого, как DALL-E. Создателя алгоритма? Пользователя?

Если бы нейросеть создавала бы картинки сама, без участия человека, то проблема бы так остро не вставала, считает Андрей Алексейчук, старший юрист практики по интеллектуальной собственности/информационным технологиям АБ «Качкин и Партнеры». Ведь авторское право защищает лишь то, что создано человеком, поэтому по закону охранялся только сам код, но не конечный результат его работы. В случае с разработкой OpenAI (и ее вариациями, в том числе ruDALL-E) дело обстоит иначе, ведь пользователь своим запросом влияет на создание изображения.

«Полагаю, что именно пользователь DALL-E должен признаваться автором созданного нейросетью произведения и, следовательно, иметь право разрешать и запрещать другим использовать это произведение. Авторы DALL-E и авторы материала, используемого для обучения, не имеют намерения и воли создать итоговый результат, а вот у пользователя такие намерения есть. Именно пользователь в конечном итоге решает, достоин ли сохранения итоговый результат или следует перезапустить программу еще раз», — объясняет Андрей Алексейчук.

И все же в настоящее время бесспорного ответа на вопрос об авторстве "творения" нейросети нет, добавляет основатель юридической компании Art Law Руслан Гацалов. «Судебная практика, в свою очередь, не имеет единого подхода к разрешению споров с таким предметом. Именно по этой причине в России в 2021 году появился национальный кодекс этики в сфере искусственного интеллекта, который призывает к "джентельменскому поведению" во взаимодействии с ИИ. Но это лишь рекомендации, не более», — объясняет он.

Выживет ли художник?

Споры вызывает также и этическая сторона вопроса. DALL-E вторгается туда, где люди не ожидали встретить конкуренцию со стороны машин — в творчество. Многие опасаются, что нейросеть может отнять работу у художников. Впрочем, с этим согласны не все.

«ИИ — это просто инструмент, используемый человеком для создания чего-то нового. Инструмент может быть простой, как кисточка, или сложный, как Adobe Photoshop, — считает Андрей Алексейчук, — Поэтому никто отрасль иллюстраторов и художников не убьет — они просто будут пользоваться новыми инструментами. Под ударом, может быть, производители кисточек, но и они, я думаю, выживут. Вы же не можете сделать DALL-E запрос "Нарисуй нечто гениальное". Точнее, можете, но вряд ли DALL-E вас поймет правильно и вы получите то, что хотите».

Примерно в этом же ключе смотрит на вещи художник Никита Реплянский. «Я заворожен новыми возможностями, которые принес мне искусственный интеллект. Я стал режиссером своих арт проектов, у которого появилась личная виртуальная арт команда в лице ИИ. Я фокусируюсь на содержании, идеях и философии своих работ, сократив время на их реализацию. А также нахожу десятки новых визуальных решений своих же замыслов, оставляя только то, что характеризует мое видение мира. Какие-то креативные сферы действительно изменятся до неузнаваемости. Например, создание концептов для игр и кино. Появятся и новые профессии, новые жанры. Новые имена, которые станут очень известными благодаря работе с ИИ», — отметил он, добавив, что по мере развития возможностей ИИ авторские работы, на сто процентов сделанные руками, будут цениться не меньше, а даже больше.

В любом случае, отмечает Валерия Ефимова, говорить о том, что нейросети убьют профессию художника как минимум преждевременно. «Даже DALL-E 2 генерирует изображения в недостаточном разрешении для печати в типографии (на страницах или обложке книги при качественной печати это будет примерно 8х8 см), для генерации изображений в еще большем разрешении потребуются колоссальные ресурсы, — отмечает она, — [сможет ли нейросеть заменить иллюстратора]? Смотря какие требования предъявлять к иллюстрации. В отдаленном будущем — да, но не в ближайшие 5 лет».

Руслан Гацалов

Основатель юридической компании Art Law:

Художник не может отрицать настоящее, поскольку своими работами он говорит со своим поколением. Единственное, что ему остается, взять любой научный прогресс в союзники. Нет никакого сомнения в том, что искусственный интеллект станет частью искусства будущего. Безусловно, будут проявляться и минусы, ну например, все, что касается вопросов человеческих эмоций и чувств. Но будем честны, наши чувства и эмоции частично уже притуплены. Сегодняшний театр обращается к нашему умственному восприятию, литература и музыка тоже, и даже изобразительное искусство.

Искусственный интеллект, в каком бы виде он ни существовал, каким бы стремительным ни было его развитие, будет подчинен руке человека, способного выдернуть блок питания из розетки. Думаю, что для художника искусственный интеллект должен и станет новой краской в палитре.

Поделиться:

Все обсуждают нейросеть DALL-E, которая рисует изображения по текстовым запросам. Ее зовут «убийцей художников» и прочат арт-революцию

Что такое DALL-E?

Как работает DALL-E?

От Моны Лизы до Cosmopolitan

От Malevich до Kandinsky

Общество будущего: цифровая душа, доверие вместо кредитной истории и победа над авторитаризмом

Спор о правах

Выживет ли художник?

Руслан Гацалов

Комментарии (0)

Наши проекты

Купить журнал:

Выберите свой город:

Ваш город

Белгород?

Поделиться:

Все обсуждают нейросеть DALL-E, которая рисует изображения по текстовым запросам. Ее зовут «убийцей художников» и прочат арт-революцию

Что такое DALL-E?

Как работает DALL-E?

От Моны Лизы до Cosmopolitan

От Malevich до Kandinsky

Общество будущего: цифровая душа, доверие вместо кредитной истории и победа над авторитаризмом

Спор о правах

Выживет ли художник?

Руслан Гацалов

Комментарии (0)

Наши проекты

Купить журнал:

Отправка сообщения об ошибке

Выберите свой город:

Ваш город

Белгород?

Выберите проект: