Миф 1. Быстро, дешево и без усилий
Многие ошибочно полагают, что создание изображений с помощью генеративного искусственного интеллекта (ИИ) — это простой процесс, аналогичный работе кофемашины: достаточно ввести несколько ключевых слов, таких как «кинематографический портрет» или «гиперреализм 8k», и мгновенно получить шедевр. Если результат не устраивает, предполагается, что дело лишь в неправильно подобранных словах, и требуется лишь повторить попытку.
В действительности же этот процесс больше напоминает управление полноценной кофейней, требующей значительных инвестиций в персонал, сырье, оборудование, расходные материалы и оплату коммунальных услуг.
Во-первых, не все генеративные ИИ-модели представлены в виде удобных онлайн-чатов с кнопкой «сгенерировать». Многие из них — это так называемые «локальные» программы, требующие установки на компьютер и занимающие от 10 до 20 гигабайт памяти, а порой и больше. Хотя такие модели доступны для бесплатной загрузки, их «бесплатность» часто обманчива и ведет к значительным дополнительным расходам. Для стабильной генерации высококачественных изображений необходима мощная видеокарта, желательно с 16–24 ГБ видеопамяти. Это уже не обычный офисный компьютер, а специализированное оборудование, стоимость которого может достигать сотен тысяч рублей.
Более того, использование локальных моделей приводит к значительному потреблению электроэнергии. Создание одного изображения в разрешении 4K может занимать до пяти минут. Однако для достижения желаемого результата часто требуются десятки или даже сотни попыток, что неизбежно увеличивает ежемесячные счета за электричество в несколько раз.
В качестве альтернативы существуют облачные сервисы, доступные по подписке. Они предлагают более высокую скорость и мощность, но также требуют финансовых затрат. Стоимость напрямую зависит от качества и разрешения генерируемых изображений. Популярные платформы обычно стоят $30–40 в месяц, предоставляя ограниченное количество генераций — например, около 300 изображений или несколько десятков коротких видео. Хотя такой объем может показаться достаточным для личного использования или малого бизнеса, существует важный нюанс: редко удается получить идеальный результат с первой попытки, особенно для коммерческих проектов или точной визуализации. Если на одну задачу уходит пять, десять или пятнадцать попыток, то из 300 генераций в итоге остается всего 30–60 подходящих работ. Для большего объема необходимо приобретать дополнительные токены или переходить на более дорогой тариф.
Помимо финансовых затрат, следует учитывать и временные. Многие сервисы ограничивают количество одновременных генераций, например, до трех изображений или видео за раз, не позволяя начать новый процесс до завершения текущего.
Работа с нейросетями сопряжена с издержками не только для пользователя, но и для окружающей среды. Каждый запрос к генеративной модели активизирует работу мощных дата-центров, множества серверов и систем их охлаждения. Существует яркая, хоть и условная, аналогия: одно простое «спасибо», отправленное чат-боту, может потреблять столько же энергии, сколько необходимо для кипячения электрического чайника. В масштабе миллионов пользователей такое энергопотребление становится критически значимым. Обучение крупномасштабных моделей ИИ также требует колоссальных вычислительных ресурсов — порой это тысячи видеокарт, работающих без перерыва на протяжении многих недель. В некоторых регионах высокая концентрация дата-центров уже становится причиной серьезных экологических споров.
Миф 2. Все делает машина
Возникновение нейросетей часто сопоставляют с появлением фотографии в XIX веке, когда художники-живописцы утратили исключительное право на отображение реальности. Сегодня схожие трансформации переживают иллюстраторы, дизайнеры и музыканты. Однако, подобно тому как фотоаппарат не делает снимки сам по себе, генеративные модели не могут создавать произведения без участия человека. Искусственный интеллект не выбирает тему, не формулирует концепцию и не несет ответственности за смысл создаваемого контента. Генеративная модель — это система, обученная на обширных данных, чья основная функция заключается в предсказании наиболее вероятного продолжения заданного запроса. Иначе говоря, она не обладает «знанием» или «чувством» лучшего; она лишь статистически стремится воспроизвести результат, который максимально соответствует человеческим представлениям о целесообразности или красоте.
Таким образом, центральная роль по-прежнему принадлежит человеку. Именно он задает тему, подбирает визуальные ориентиры, формулирует текстовый запрос (промпт) и принимает решение о том, какие результаты использовать, а какие отбраковать. Создание задуманного произведения требует значительной внутренней дисциплины и настойчивости. Существует высокая вероятность поддаться искушению: получив результат, отличающийся от первоначальной задумки, но при этом эстетически привлекательный, легко согласиться на предложенный вариант. Однако, если художник беспрекословно принимает каждое решение, предложенное программой, его авторство постепенно утрачивается. Для сохранения оригинальности необходимо твердо следовать первоначальной идее, постоянно корректируя нейросеть, чтобы она соответствовала задумке, или же осознанно модифицировать саму идею.
Миф 3. ИИ — идеальный исполнитель
Взаимодействие с ИИ может быть психологически сложным. В отличие от индивидуальной работы художника, использование нейросетей создает ощущение постоянного диалога, в котором, однако, ваш собеседник понимает вас лишь частично. Несмотря на внешне дружелюбный и готовый помочь тон чат-интерфейсов, нейросеть способна ошибочно истолковать запрос, проигнорировать ключевые детали или внезапно изменить композицию. Порой создается впечатление, что она настойчиво предлагает свои собственные интерпретации.
Многие распространенные модели ИИ вовсе не предполагают диалогового режима. В специализированных системах процесс взаимодействия строится по принципу «запрос — визуальный результат». Пользователь формулирует текстовое описание, возможно, дополняя его изображением-референсом, а нейросеть в ответ генерирует картинку без каких-либо комментариев.
Отдельного внимания заслуживает проблема цензуры. В общедоступных локальных моделях фильтры минимальны или отсутствуют полностью, что предоставляет художникам широкую свободу творчества. Это позволяет экспериментировать с темами телесности, тревожными образами и радикальными сюжетами, которые обычно блокируются фильтрами безопасности в платных сервисах. Однако эта вседозволенность имеет и негативные последствия: экосистема ИИ-моделей переполнена контентом для взрослых и программами, часто используемыми в сомнительных целях.
Платные сервисы, напротив, функционируют по иным принципам. Иногда они ведут себя как чрезмерно осторожный взрослый, постоянно твердящий «нельзя» или «опасно». Система может отклонить запрос на генерацию, если посчитает сцену неэтичной. Например, изображение человека под водой может быть интерпретировано как угроза жизни, а абстрактная композиция из человеческих фигур — как нарушение этических норм. В таких случаях художнику приходится оттачивать навыки «дипломатии»: работа превращается в интеллектуальный квест по подбору «правильных слов», способных точно выразить идею, но при этом обойти внутренние «моральные кодексы» и защитные механизмы системы.
Миф 4. Все как под копирку
Это одно из наиболее распространенных обвинений в адрес художников, использующих ИИ. В социальных сетях часто встречаются однотипные и порой бессмысленные изображения, будь то странные животные, превращающиеся в нечто необычное, или стилизованные рекламные видеоролики, имитирующие известные бренды. Может показаться, что все работы, созданные с помощью нейросетей, одинаковы. Однако это скорее алгоритмическая иллюзия: платформы активно продвигают контент, который генерирует наибольшее количество просмотров, то есть мемы, простой и развлекательный материал. Именно этот тип контента доминирует в лентах пользователей, создавая ложное впечатление однородности. За пределами этого алгоритмического «фасада» скрывается гораздо более разнообразное творческое поле: артхаусные, сюрреалистические и экспериментальные работы, где основной целью является не массовый охват, а глубокое исследование эмоций, состояний и визуального потенциала самой технологии.
Как и в любой форме визуального искусства, в генеративном ИИ постепенно формируются свои узнаваемые стили и мотивы. К примеру, большой популярностью пользуются изображения рыцарей или космонавтов среди цветущих ландшафтов, сюрреалистические дримкор-пейзажи (визуальная интернет-эстетика, для которой характерны образы, напоминающие о странных или кошмарных снах) с заброшенными детскими площадками, а также бесчисленные вариации киберпанка. Появление «копий» объясняется простым механизмом: новички в сфере ИИ-искусства, стремясь к успеху, подражают стилю популярных авторов. Студенты онлайн-курсов по нейросетям часто копируют манеру своих преподавателей, не осознавая, что успех учителя обусловлен его индивидуальным видением. По сути, копирование на начальных этапах — это естественный процесс обучения для любого художника или дизайнера. Однако в контексте нейросетей этот феномен становится значительно более выраженным, поскольку инструмент общедоступен, скорость создания изображений чрезвычайно высока, и на каждого опытного автора приходится тысячи новичков.
Технологические особенности также способствуют однообразию. Генеративное искусство в его современном воплощении появилось относительно недавно: первые значимые эксперименты с нейросетями в этой области относятся к середине 2010-х годов (например, генеративно-состязательные сети (GANs) — это вид генеративных моделей искусственного интеллекта, которые обучаются в процессе конкуренции двух нейронных сетей: одна генерирует данные, а другая пытается отличить их от реальных), а массовое распространение инструментов началось лишь в 2020-х. Ранние модели часто допускали ошибки, которые, однако, имели свою прелесть: аморфные очертания, дополнительные пальцы, странные искажения. Эти «сбои» не только стали основой для многочисленных мемов, но и обладали художественным потенциалом, добавляя в задумку автора неожиданные и выразительные элементы.
Дальнейшее развитие технологий, однако, привело к усреднению результатов. Современные модели, обученные на колоссальных объемах визуальных данных, легко воспроизводят то, что общепринято считать «красивым»: кинематографическое освещение, идеально гладкую кожу, симметричные композиции. Как следствие, возникает бесконечный поток эстетически привлекательных, но часто взаимозаменяемых изображений. В связи с этим меняется и задача художника: по сути, ему необходимо «взломать» систему, найти способы обойти алгоритмы и вывести ИИ за рамки стандартного визуального языка. Иногда это подразумевает сознательное нарушение логики ИИ, смешение несовместимых стилей или намеренное провоцирование ошибок — подход, во многом схожий со стратегиями современного искусства.
Миф 5. Вы воруете у реальных художников
Это, пожалуй, наиболее острое и сложно опровергаемое обвинение.
Генеративные модели обучаются на колоссальных массивах данных, включающих фотографии, иллюстрации и живопись — весь контент, когда-либо опубликованный в интернете в открытом доступе. Именно таким образом ИИ формирует понимание гармоничной композиции и эстетически приятных цветовых сочетаний. При этом создатели оригинальных произведений, естественно, не давали согласия на использование своих работ для обучения этих моделей. Теоретически, компании могли бы приобретать лицензии на использование произведений и обучать алгоритмы на законных основаниях. Однако на практике это почти невыполнимо, поскольку речь идет о миллиардах изображений, и ни один юридический департамент не способен обработать такой объем данных.
Существует и другая сторона этой проблемы: многие модели ИИ эффективно реагируют на упоминание имен конкретных авторов в текстовом запросе (промпте) — текстовом запросе, который пользователь отправляет нейросети для создания контента. Например, можно запросить создание изображения «в стиле Дэвида Линча» или другого известного иллюстратора и получить результат, стилистически близкий к их работам. При этом оригинальный художник, разумеется, не получает никакой компенсации за использование своего стиля.
Эта ситуация особенно сильно повлияла на начинающих иллюстраторов и фотографов. Их работы, как правило, стоят недорого, но их качество не всегда соответствует требованиям заказчика. В таких случаях клиентам нередко проще и быстрее самостоятельно сгенерировать необходимое изображение, чем составлять подробное техническое задание и проходить через многочисленные циклы правок. Для опытных авторов эта проблема менее остра, поскольку к ним обращаются не только за техническими умениями, но и за их уникальным художественным видением, концептуальным подходом и неповторимым стилем.
Эффективного решения этой проблемы пока не существует. Генеративные модели прочно укоренились в цифровом пространстве и вряд ли исчезнут в обозримом будущем. Любое изображение, попадающее в интернет, автоматически становится частью обширного массива данных, на основе которого обучаются алгоритмы ИИ.
Однако на эту ситуацию можно взглянуть и под иным углом. Хотя генеративные модели чаще всего обсуждаются в контексте искусства, их наибольшее влияние, возможно, проявится в сфере дизайна. История технологического развития свидетельствует о том, что новые инструменты редко полностью заменяют человека, но практически всегда трансформируют методы его работы. В прошлом дизайнеры обходились без Photoshop, используя лишь ножницы, пленку и фотолаборатории. Появление цифровых технологий значительно ускорило рабочие процессы и расширило творческие возможности, но не привело к исчезновению профессии.
С генеративными моделями наблюдается схожая тенденция. Они автоматизируют часть рутинных операций, дают возможность быстрее проверять концепции и экспериментировать с формами. Однако определение общего направления, передача смысла и ответственность за конечный результат остаются прерогативой человека. Следовательно, главный вопрос не в том, сможет ли искусственный интеллект заменить художников, а в том, как художники смогут освоить и интегрировать этот новый инструмент в свою творческую практику.
