Новости IT: Reddit подал в суд на Perplexity за несанкционированный сбор и использование данных для ИИ | Новости IT perec.ru

Reddit подал в суд на Perplexity за воровство данных

23.10.2025, 02:17:02 ИТОбщество
Подписаться на «Рифы и пачки / Твоя культура»
Reddit подал в суд на Perplexity за воровство данных

Reddit подал в суд на четыре компании — SerApi, OxyLabs, AWMProxy и Perplexity — за то, что они якобы собирали контент с сайта без оплаты и лицензии. Согласно материалам дела, эти компании массово собирали (скрапили) посты и другую информацию с Reddit, используя поисковики, чтобы потом использовать собранные данные, в том числе для обучения искусственного интеллекта. Reddit с 2023 года взял курс на монетизацию своих данных: для корпоративного доступа к постам теперь нужна плата. Особенно после того, как содержимое форума оказалось ценнейшим сырьем для обучения ИИ. Например, Reddit уже заключил сделки с такими IT-гигантами, как Google и OpenAI, а также внедрил собственную функцию AI-ответов, работающую с постами пользователей. Собирая же данные с помощью поисковиков, можно было обойти плату. Вот почему Reddit требует как компенсацию деньги и пожизненный запрет на продажу уже украденного контента.

В иске фигурируют, мягко говоря, не самые известные компании (SerApi, OxyLabs, AWMProxy). Бизнес которых — как бы случайный «сбор данных из поиска с последующей продажей». Perplexity же попадание в иск объясняет само собой. Этой AI-компании ежедневно нужно море текстов для обучения моделей. Она уже уличалась в копировании текстов без лицензии, а также в игнорировании протокола robots.txt — как бы бордюра для ботов, призванного предотвращать автоматизированный сбор контента.

Reddit утверждает, что официально предлагал Perplexity прекратить сбор контента без лицензии (через письмо о прекращении и воздержании — cease-and-desist), но та предпочла делать вид, что ничего не было — и продолжала использовать материалы Reddit в ответах ИИ. Для доказательства Reddit создал фейковый тестовый пост, который мог увидеть только Google. Через несколько часов Perplexity уже выдала содержимое этого поста в качестве ответа своим пользователям — иначе как автоматическим сбором данных это не объяснить.

Perplexity заявила в ответ, что иск ещё не получен, но они намерены бороться за «свободный доступ к публичным знаниям», действуют ответственно, и не потерпят угроз открытости и общественным интересам.

Новая волна тяжбы отражает агрессивную стратегию Reddit по защите своих данных: теперь сайт ограничивает неизвестных ботов, а с 2025 года даже урезает доступ к своему архиву для Wayback Machine (крупнейший интернет-архив). Также Reddit внедрила новый стандарт Really Simple Licensing, делающий robots.txt юридически обязывающим документом, а лицензирование — неотъемлемым требованием для тех, кто всё же хочет копаться в чужих сообществах.


PEREC.RU

Новая война гигантов данных пошла по накатанной схеме: когда кто-то один – тут Reddit – вдруг решает монетизировать коллективную мудрость, всегда находится пара жадных «стартаперов», которым запрещай – не запрещай, а хочется навариться на чужом. Механика легко узнаваемая: появляется модная тема (ИИ), все бегут собирать данные, лоббисты волнуются за свободу доступа – а потом кто-то подаёт в суд и объясняет: эта свобода стоит конкретных денег.

Персонажи классические. Reddit превратился из уютного форума в коммерческую машину для обсчёта мыслей пользователей. Perplexity и коллеги на голубом глазу хватают, что плохо лежит – главное скормить своему искусственному собеседнику очередную порцию не своего. Все притворяются благородными: Reddit заботится о пользователях, ИИ-стартапы ратуют за просвещение. В реальности – каждый хочет отжать максимум ценности, не потратив ни копейки лишнего.

Забавно, что Reddit не ограничился выговорами: он закручивает гайки для всех автоматизированных сборщиков данных, даже для легендарного архива Wayback Machine, которому теперь тоже не рады. Новый юридический стандарт – ещё одна попытка контролировать информационные потоки и создавать собственную монополию на историю обсуждений и мемов. Та самая "битва за знания" превращается в битву кошельков с ботами на подстраховке. Победят только юристы и те, кто придумает, как снова обойти запрет.

Поделиться

Похожие материалы