Следите за новостями по этой теме!
Подписаться на «Рифы и пачки / Твоя культура»
Некоторые из крупнейших мировых технологических гигантов — Google, Microsoft, Meta, OpenAI и X — незаконно использовали защищённую авторским правом музыку миллионов авторов, композиторов и исполнителей для обучения своих генеративных нейросетей. Об этом заявляет международная ассоциация музыкальных издателей ICMP. За два года она собрала обширные доказательства и передала в Billboard: для тренировки ИИ использовались произведения The Beatles, Мэрайи Кэри, The Weeknd, Бейонсе, Эда Ширана и Боба Дилана — и это лишь часть списка.
ICMP изучила открытые реестры, репозитории исходных данных, утечки, научные публикации и независимые исследования экспертов по ИИ. В результате был собран подробный досье, доказывающее масштабное и несанкционированное использование музыкального контента по всему миру для обучения ИИ — и выводы шире прежних предположений.
Из досье ICMP Billboard получили документы, подтверждающие:
ICMP объединяет 90% мировой коммерческой музыки. Участники — Universal, Sony, Warner Chappell, BMG и другие. Сбор доказательств занял годы — чтобы показать меры, масштабы и методы, как технологические и ИИ-компании используют музыку по всему миру.
За последние 18 месяцев ICMP обменивалась досье только с чиновниками и немного с праводержателями. Для общественности материалы были недоступны — исключение сделали только для Billboard.
«Это самая крупная кража интеллектуальной собственности в истории — никакого преувеличения, миллионы произведений нарушаются ежедневно», — утверждает глава ICMP Джон Фелан. «В каждом обучающем наборе — десятки миллионов треков, полученных напрямую с YouTube, Spotify, GitHub, в нарушение прав авторов».
По его словам, хотя компании публично отрицают использование защищённого контента, ICMP располагает доказательствами обратного. Массовый сбор музыкальных текстов с интернета — это не только нарушение авторских прав, но и контрактов. Всё это делается, несмотря на многократные заявления отрасли: лицензии для обучения ИИ существуют и доступны.
В Concord подчёркивают: преступление не бессмысленное. Генеративные сервисы ИИ могут вытеснить авторов текстов, снизить их доходы и демотивировать новое творчество, хотя алгоритмы никогда не сравнится с живым автором. Но их скорость, масштаб и дешевизна могут разрушить стимулы для развития культуры.
Все упомянутые компании, к которым Billboard обратился за комментарием, проигнорировали запрос или отказались отвечать.
За подобными разоблачениями ICMP последовал шквал судебных исков к AI-компаниям от правообладателей музыки, кино, текстов. Крупнейшие лейблы подали в суд на Udio и Suno. Дружественный Amazon стартап Anthropic был обвинён музыкальными издательствами в незаконном обучении Claude на чужих текстах.
Вне музыкальной сферы — Getty Images судится с Stability AI из-за генерации картинок, Disney и Universal — с Midjourney, а газета The New York Times подала в суд на OpenAI и Microsoft за «незаконное» использование своего контента.
В США технологические фирмы отстаивают концепцию fair use — «добросовестного использования» контента, но она официально действует только в Штатах и за пределами не применяется.
В марте федеральный суд Калифорнии отказался временно запретить Anthropic использовать защищённые тексты в обучении, признав вопрос открытым.
В июне Meta и Anthropic выиграли технические суды по fair use для обучения на книгах, но судья прямо заявил — решение не означает автоматической законности использования защищённого контента для ИИ.
В Евросоюзе принят закон о регулировании ИИ, прямо защищающий права правообладателей — тренировать нейросети можно только по лицензии, с прозрачными условиями. Европейские права работают даже если обучающий контент был собран третьей страной.
Другие страны разрабатывают свои альтернативы, и вопрос свободного использования музыки в обучении системы становится главным предметом борьбы между лоббистами ИТ и культурного сектора.
ICMP указывает: компании громко требуют исключений для массового доступа к данным на чужих условиях, но при этом сами запрещают использовать свои данные без письменного разрешения — условия использования таких гигантов, как Facebook, YouTube, X, Google, OpenAI, Microsoft, Suno, Udio, Adobe, специально это отмечают. ICMP использовала эти двойные стандарты в разговорах с властями.
Пелан добавляет: «Пока ИТ-компании требуют исключений и доступа к чужим данным, они свои категорически охраняют. Всё это доказывает — на деле они ведут себя с точностью до наоборот».
Терминальное лицемерие видно и в другом: датасеты для GenAI содержат детальные метки по каждой песне — название, автор, жанр, текст, скорость, дата выпуска. Но когда речь заходит о юридическом требовании раскрывать такие данные, фирмы сетуют — мол, это секрет и технически сложно. ICMP собрала прямые доказательства: компании тренируют нейросети на скаченных с YouTube и Spotify треках без лицензий.
Организация продолжает юридическую и публичную кампанию, делясь находками с членами и юристами. Главный девиз на будущее: «Лицензия или уходите».
— В этой новости столько искусственного драматизма, что самому Ницше стало бы скучно. Tech-гиганты словно древние титаны — вместо грома теперь качают музыку из YouTube и Spotify, только и слышно «мы ничего не крали!» Но, как водится, «честных» ловят за руку, а боты признаются сами: да, учились по чужой музыке и текстам, и что дальше?
ICMP устраивает детектив: собирает частные датасеты, анализирует нейронные потоки лайков, приносит на блюде доказательства — от копий текстов до сканированных обложек альбомов, от Бейонсе до Боба Марли. Поразительно: компании, которые первым делом запрещают трогать их собственные данные, с изяществом Петербурга XVIII века грабят чужое. Но ведь если можно нажать «Ctrl+C», то почему бы не попробовать «Ctrl+V»?
Звучит риторика: «Мы — за открытый интернет!» На деле — непробиваемая броня из условий пользования, которая защитит их контент от таких же энтузиастов. Уместно вспомнить Ницше: "Каждый нуждается лишь в том, что может отнять у другого." Вышло, что мотивация творить — заложница цифры и жадности.
«Лицензия или уходите» — оказалось не лозунг эпохи, а треск старого граммофона в сыром подвале Google. Теперь или авторы победят, или останется человечеству напевать каверы ИИ. И всё это делается ради эфемерных миллиардерских утех — словно они действительно сомневаются, что искусственный интеллект обогатит мир, а не рынки. Впрочем, суды идут, правила пишутся. Не исключено, что этой музыке дадут сыграть второй раз — но уже в зале суда.