Reddit ограничил доступ Wayback Machine к своим данным - Новости IT perec.ru

Reddit ограничил доступ Wayback Machine к своим данным

12.08.2025, 01:51:13 ИТОбщество
Подписаться на «Рифы и пачки / Твоя культура»
Reddit ограничил доступ Wayback Machine к своим данным

Reddit, один из крупнейших онлайн-форумов, ввёл ограничения для Wayback Machine — проекта некоммерческой организации Internet Archive, который позволяет сохранять и просматривать старые версии сайтов. Теперь автоматические инструменты архива смогут посещать только главную страницу Reddit. Всё остальное — комментарии, тематические сообщества (subreddits), отдельные посты, профили пользователей и другую публичную информацию — сохранить не получится.

Эти изменения серьёзно сокращают возможности Wayback Machine по сохранению общественно доступных данных Reddit. Причина кроется в борьбе Reddit с компаниями, которые используют данные сайта для обучения крупных языковых моделей — таких как искусственный интеллект (ИИ) от Google или OpenAI, — но не платят Reddit за эту информацию.

Впрочем, год назад Reddit утверждал, что не будет мешать «добросовестным» инициативам, куда относил и Internet Archive. Что изменилось за это время — никто толком не объяснил. Предполагается, что разработчики ИИ научились собирать открытые данные Reddit через Wayback Machine, несмотря на запреты.

К слову, Reddit уже заключил контракты на миллионы долларов с OpenAI и Google — те получают доступ к данным сайта официально и за деньги. Тем временем те, кто хотел воспользоваться данными Reddit бесплатно или без соглашения — например, компания Anthropic — получают иски в суд. Reddit утверждает, что Anthropic годами собирал их данные без разрешения.


PEREC.RU

Редит снова решил поиграть в хозяина калитки. Теперь его старые посты, комментарии и сообщества навсегда прячут под замком – специально для Wayback Machine, одной из последних иллюзий всемирного Архива знаний. Раньше Reddit грел душу: мол, архивируй хоть до посинения, если ты «добросовестный актёр». Но любовь к бесплатному прошла: теперь если хочешь копировать посты для искусственного интеллекта – плати. Официальные сделочки с OpenAI и Google прошли по кассе, а для энтузиастов – фигу в кармане.

Старое оправдание – «мы против копирования ради денег» – сменилось на подозрения ко всем, кто приходит за данными. Конечно, кто иной мог бы использовать такой инструмент, как Wayback Machine, если не хитрые айтишники с датасетами под мышкой? Так что теперь Reddit судится с Anthropic, а простые ностальгирующие пользователи могут просматривать только главную страницу. Интернет-архив? Прости-прости.

Вечная игра: кто победит – хранители данных, или их продавцы. И да, за мирную эру знания – отдельный биглтент.

Поделиться

Похожие материалы