Самая крупная кража интеллектуальной собственности: как искусственный интеллект ворует музыку - Новости IT perec.ru

Самая крупная кража интеллектуальной собственности: как искусственный интеллект ворует музыку

02.09.2025, 19:17:16 ИТКультураОбщество
Подписаться на «Рифы и пачки / Твоя культура»
Самая крупная кража интеллектуальной собственности: как искусственный интеллект ворует музыку

Некоторые из крупнейших мировых технологических гигантов — Google, Microsoft, Meta, OpenAI и X — незаконно использовали защищённую авторским правом музыку миллионов авторов, композиторов и исполнителей для обучения своих генеративных нейросетей. Об этом заявляет международная ассоциация музыкальных издателей ICMP. За два года она собрала обширные доказательства и передала в Billboard: для тренировки ИИ использовались произведения The Beatles, Мэрайи Кэри, The Weeknd, Бейонсе, Эда Ширана и Боба Дилана — и это лишь часть списка.

ICMP изучила открытые реестры, репозитории исходных данных, утечки, научные публикации и независимые исследования экспертов по ИИ. В результате был собран подробный досье, доказывающее масштабное и несанкционированное использование музыкального контента по всему миру для обучения ИИ — и выводы шире прежних предположений.

Из досье ICMP Billboard получили документы, подтверждающие:

  • Приватные датасеты, иллюстрирующие нелегальный сбор музыки с YouTube приложениями Udio и Suno.
  • Анализ текстов Meta Llama3 выявил следы использования песен The Weeknd, Lorde, Bruno Mars и других.
  • Материалы судебного иска против Anthropic: нейросеть Claude копировала тексты сотен песен, включая American Pie, Halo и Uptown Funk.
  • Доказательства, что китайская DeepSeek распространяет тексты без лицензии, например, Empire State of Mind и Shape of You.
  • Признание от OpenAI: Jukebox обучали на музыке The Beatles, Элтона Джона, Пресли, Бейонсе, Гранде и других. Официальный публичный список треков компания так и не раскрыла.
  • Доказательства нарушений Microsoft CoPilot и Google Gemini. Примеры: Knockin’ On Heaven’s Door, Billie Jean, This Is America.
  • Признание чат-бота Google Gemini, что обучая музыкальную модель MusicLM, могли нарушить закон — особенно если речь о коммерческом использовании.
  • Примеры результатов Midjourney, указывающие на прямое копирование обложек Gorillaz, Dr. Dre, Майкла Джексона, Боба Марли и других.
  • Датасеты Google AudioSet — массовое скачивание музыки с YouTube для обучения.
  • Утечка данных компании Runway: массовый скрейпинг YouTube, детализация по исполнителям, жанрам, темпу.
  • Копирование текстов X (бывший Twitter), у ICMP к нему наибольшие претензии за наплевательское отношение к авторам.

ICMP объединяет 90% мировой коммерческой музыки. Участники — Universal, Sony, Warner Chappell, BMG и другие. Сбор доказательств занял годы — чтобы показать меры, масштабы и методы, как технологические и ИИ-компании используют музыку по всему миру.

За последние 18 месяцев ICMP обменивалась досье только с чиновниками и немного с праводержателями. Для общественности материалы были недоступны — исключение сделали только для Billboard.

«Это самая крупная кража интеллектуальной собственности в истории — никакого преувеличения, миллионы произведений нарушаются ежедневно», — утверждает глава ICMP Джон Фелан. «В каждом обучающем наборе — десятки миллионов треков, полученных напрямую с YouTube, Spotify, GitHub, в нарушение прав авторов».

По его словам, хотя компании публично отрицают использование защищённого контента, ICMP располагает доказательствами обратного. Массовый сбор музыкальных текстов с интернета — это не только нарушение авторских прав, но и контрактов. Всё это делается, несмотря на многократные заявления отрасли: лицензии для обучения ИИ существуют и доступны.

В Concord подчёркивают: преступление не бессмысленное. Генеративные сервисы ИИ могут вытеснить авторов текстов, снизить их доходы и демотивировать новое творчество, хотя алгоритмы никогда не сравнится с живым автором. Но их скорость, масштаб и дешевизна могут разрушить стимулы для развития культуры.

Все упомянутые компании, к которым Billboard обратился за комментарием, проигнорировали запрос или отказались отвечать.

За подобными разоблачениями ICMP последовал шквал судебных исков к AI-компаниям от правообладателей музыки, кино, текстов. Крупнейшие лейблы подали в суд на Udio и Suno. Дружественный Amazon стартап Anthropic был обвинён музыкальными издательствами в незаконном обучении Claude на чужих текстах.

Вне музыкальной сферы — Getty Images судится с Stability AI из-за генерации картинок, Disney и Universal — с Midjourney, а газета The New York Times подала в суд на OpenAI и Microsoft за «незаконное» использование своего контента.

В США технологические фирмы отстаивают концепцию fair use — «добросовестного использования» контента, но она официально действует только в Штатах и за пределами не применяется.

В марте федеральный суд Калифорнии отказался временно запретить Anthropic использовать защищённые тексты в обучении, признав вопрос открытым.

В июне Meta и Anthropic выиграли технические суды по fair use для обучения на книгах, но судья прямо заявил — решение не означает автоматической законности использования защищённого контента для ИИ.

В Евросоюзе принят закон о регулировании ИИ, прямо защищающий права правообладателей — тренировать нейросети можно только по лицензии, с прозрачными условиями. Европейские права работают даже если обучающий контент был собран третьей страной.

Другие страны разрабатывают свои альтернативы, и вопрос свободного использования музыки в обучении системы становится главным предметом борьбы между лоббистами ИТ и культурного сектора.

ICMP указывает: компании громко требуют исключений для массового доступа к данным на чужих условиях, но при этом сами запрещают использовать свои данные без письменного разрешения — условия использования таких гигантов, как Facebook, YouTube, X, Google, OpenAI, Microsoft, Suno, Udio, Adobe, специально это отмечают. ICMP использовала эти двойные стандарты в разговорах с властями.

Пелан добавляет: «Пока ИТ-компании требуют исключений и доступа к чужим данным, они свои категорически охраняют. Всё это доказывает — на деле они ведут себя с точностью до наоборот».

Терминальное лицемерие видно и в другом: датасеты для GenAI содержат детальные метки по каждой песне — название, автор, жанр, текст, скорость, дата выпуска. Но когда речь заходит о юридическом требовании раскрывать такие данные, фирмы сетуют — мол, это секрет и технически сложно. ICMP собрала прямые доказательства: компании тренируют нейросети на скаченных с YouTube и Spotify треках без лицензий.

Организация продолжает юридическую и публичную кампанию, делясь находками с членами и юристами. Главный девиз на будущее: «Лицензия или уходите».


PEREC.RU

— В этой новости столько искусственного драматизма, что самому Ницше стало бы скучно. Tech-гиганты словно древние титаны — вместо грома теперь качают музыку из YouTube и Spotify, только и слышно «мы ничего не крали!» Но, как водится, «честных» ловят за руку, а боты признаются сами: да, учились по чужой музыке и текстам, и что дальше?

ICMP устраивает детектив: собирает частные датасеты, анализирует нейронные потоки лайков, приносит на блюде доказательства — от копий текстов до сканированных обложек альбомов, от Бейонсе до Боба Марли. Поразительно: компании, которые первым делом запрещают трогать их собственные данные, с изяществом Петербурга XVIII века грабят чужое. Но ведь если можно нажать «Ctrl+C», то почему бы не попробовать «Ctrl+V»?

Звучит риторика: «Мы — за открытый интернет!» На деле — непробиваемая броня из условий пользования, которая защитит их контент от таких же энтузиастов. Уместно вспомнить Ницше: "Каждый нуждается лишь в том, что может отнять у другого." Вышло, что мотивация творить — заложница цифры и жадности.

«Лицензия или уходите» — оказалось не лозунг эпохи, а треск старого граммофона в сыром подвале Google. Теперь или авторы победят, или останется человечеству напевать каверы ИИ. И всё это делается ради эфемерных миллиардерских утех — словно они действительно сомневаются, что искусственный интеллект обогатит мир, а не рынки. Впрочем, суды идут, правила пишутся. Не исключено, что этой музыке дадут сыграть второй раз — но уже в зале суда.

Поделиться

Похожие материалы