Zarya of the Dawn: как сгенерированные AI изображения (не) были зарегистрированы United States Copyr
- ehodkin
- 24 июн. 2023 г.
- 4 мин. чтения

В 2022 году United States Copyright Office (USCO) зарегистрировал комикс Zarya of the Dawn, автором которого является Крис Каштанова.
Вскоре после регистрации автор комикса сделала несколько заявлений в своих соц сетях: “Я получила регистрацию от USCO на мою AI-generated graphic novel. Я была открыта как я использовала Midjorney….” Такое заявление не прошло мимо Midjorney, которые также признали этот факт определенным достижением, а также получило огласку в прессе. После этого USCO открыло кейс и решило пересмотреть свое решение.
Рассмотрим этот кейс и попытаемся разобраться что-же на самом деле произошло.
Открывая кейс USCO сообщило, что в заявке на регистрацию не было указано о том, что какие-то изображения или тексты были сгенерированы AI. Единственным упоминанием о возможной связи с AI было слово Midjorney на обложке комикса. При этом, к заявке на регистрацию прилагалось 18 jpg файлов.
В ответ автор указала, что использовала Midjorney как вспомогательный инструмент, что текст комикса создан исключительно ее авторским трудом, что компиляция текста и изображений является ее креативом.
Теперь заслушаем доводы USCO.
Тут, как всегда в США, будет много ссылок на решения Верховного суда.
Интерпретируя фразу “произведения автора” Верховный суд ограничивает их (произведения) до произведений, создаваемых человеком. Автор определяется как тот, кому что-то обязано своим происхождением. Так, Компендиум (краткий свод практики) USCO обязывает бюро отказать в регистрации заявки если будет установлено, что произведение не было создано человеком.
Теперь давайте посмотрим как USCO оценивал произведение.
Текст
Каштанова предоставила объяснение, что текст создан исключительно ей, без применения каких-либо инструментов, включаю generative AI. USCO признал что текст произведения защищается авторскими правами.
Выбор и расположение изображений и текста
USCO признал, что выбор и расположение изображений и текста произведения может защищаться как компиляция, т.к. этот процесс требует креативного участия человека.
Изображения, созданные Midjorney
Чтобы проанализировать изображения в комиксе USCO пришлось разобраться в работе Midjorney. Нам тоже придется в это немного погрузиться, иначе выводы USCO будут непонятны.
Согласно собственному описанию, Midjourney не интерпретирует промт как конкретные инструкции для создания определенного выразительного результата. Поскольку Midjourney "не понимает грамматику, структуру предложений или слов, как люди", он вместо этого преобразует слова и фразы "в более мелкие фрагменты, называемые токенами, которые можно сравнить с обучающими данными и затем использовать для создания изображения.
Промт пользователя создает четыре различных изображения на основе обучающих данных Midjourney. Хотя дополнительные промты, примененные к одному из этих начальных изображений, могут повлиять на последующие изображения, процесс не контролируется пользователем, поскольку невозможно заранее предсказать, что создаст Midjourney. Сама Каштанова заявляла, что для получения конечного изображения потребовалось множество итераций и корректировок промта.
В общем основаная претензия к Midjourney — результат не контролируется человеком и никто заранее не может предсказать что выдаст AI.
Кроме того, в своих дополнительных пояснениях Каштанова не утверждала, что создала изображения сама и использовала пассивный залог в описании как изображения “были созданы, разработаны и усовершенствованы”. Сама автор описала процесс создание изображений как “процесс проб и ошибок” в котором она предоставила “сотни или тысячи описательных промтов” Midjourney пока “сотни итераций не стали представлять ее видение”.
USCO также отметил, что Каштанова утверждала, что ее промты похожи на рассказы, но при этом не подала их на регистрацию как часть произведения или как отдельные произведения.
Изображения, дополненные автором
Некоторые изображения (только 2), сгенерированные Midjourney автор редактировала в Photoshop, поэтому решила разыграть карту — достаточного креатива со стороны человека в процессе создания изображения.
На одном из изображений были скорректированы контуре верхней губы Zarya, героини комикса.
Однако, USCO признал такую корректировку недостаточным объемом для признания авторства.
На втором фото мы видим изображение пожилой женщины с закрытыми глазами. Каштанова утверждает, что сама “состарила” изображение.
“Основываясь на описании г-жи Каштановой, USCO не может определить, какое выражение лица на изображении было привнесено с помощью Photoshop, а не создано Midjourney. Она предполагает, что Photoshop был использован для изменения промежуточного изображения Midjourney, чтобы "показать старение лица", но неясно, отредактировала ли она вручную молодое лицо на предыдущем промежуточном изображении, создала ли составное изображение, используя ранее созданное изображение пожилой женщины, или сделала что-то еще. Если г-жа Каштанова внесла существенные правки в промежуточное изображение, созданное Midjourney, эти правки могут обеспечить авторство человека и не будут исключены из нового регистрационного свидетельства.”
ФИНАЛЬНЫЕ ВЫВОДЫ USCO
Вместо инструмента, который г-жа Каштанова контролировала и направляла для достижения желаемого образа, Midjourney генерирует изображения непредсказуемым образом. Соответственно, пользователи Midjourney не являются "авторами" для целей авторского права изображений, которые генерирует технология. Как объяснил Верховный суд, "автором" произведения, охраняемого авторским правом, является тот, "кто фактически сформировал изображение", тот, кто действует как "изобретательский или главный ум". Человек, предоставляющий текстовые подсказки Midjourney, не "фактически формирует" созданные изображения и не является "мастермайндом", стоящим за ними. Вместо этого, как объяснялось выше, Midjourney начинает процесс генерации изображений с поля визуального "шума", который уточняется на основе маркеров, созданных из подсказок пользователя, относящихся к базе данных обучения Midjourney. Информация в подсказке (промте) может "влиять" на генерируемое изображение, но текст подсказки не диктует конкретный результат. См. Prompts, MIDJOURNEY, https://docs.midjourney.com/docs/prompts (объясняется, что короткие текстовые подсказки приводят к тому, что "каждое слово [оказывает] более сильное влияние" и что изображения, включенные в подсказку, могут "влиять на стиль и содержание готового результата"). Из-за значительного расстояния между тем, что пользователь может поручить Midjourney создать, и визуальным материалом, который Midjourney фактически создает, пользователи Midjourney не имеют достаточного контроля над создаваемыми изображениями, чтобы их можно было рассматривать как "мастермайнд", стоящий за ними.
В итоге, первоначальная заявка на регистрацию была отменена и заменена новой. Защиту получил "текст" и "выбор, координация и расположение текста, созданного автором, и художественного оформления, созданного искусственным интеллектом".
Полностью сгенерированные AI изображения не подлежат защите. Однако, определенная степень коррекции человеком, может изменить ситуацию.
Осталось определиться с двумя вопросами:
степень корректировки и
а может просто никому не говорить кто действительно создал изображение?
Comments