
Энциклопедия Britannica и издатель словарей Merriam-Webster подали в суд на OpenAI, обвиняя компанию в том, что она без разрешения использовала их материалы для обучения моделей искусственного интеллекта. По словам истцов, модели вроде GPT-4 якобы не просто изучали их тексты, а «запомнили» значительные фрагменты и теперь способны выдавать ответы, почти дословно совпадающие с оригиналом.
Britannica утверждает, что OpenAI систематически копировала её материалы без согласия, а затем использовала якобы «запомненные» отрывки для работы своих моделей. По словам представителей энциклопедии, GPT-4 в отдельных случаях может выдавать крупные фрагменты текста, совпадающие с их статьями до степени «почти полных цитат». В иске подчёркивается, что такие совпадения — не результат обычного пересказа, а следствие фактического хранения оригинальных фрагментов в модели.
Иск подчеркивает, что это считается созданием несанкционированных копий. Britannica и Merriam-Webster настаивают, что OpenAI нарушила авторские права, используя их контент как тренировочный материал для своих ИИ-систем. Компании утверждают, что OpenAI получила коммерческое преимущество, не заплатив за доступ к premium-контенту, который обычно продаётся по подписке.
OpenAI пока не дала детальный публичный ответ на обвинения, но спор вписывается в большую волну судебных процессов против разработчиков ИИ, которых обвиняют в «несанкционированной цифровой выемке» чужого контента. В юридической плоскости такие дела стали проверкой того, где проходит граница между обучением ИИ и нарушением авторских прав.
Эта история выглядит как типичная ссора старых домов культуры с новыми техногигантами. Britannica и Merriam-Webster говорят про память модели — почти как будто GPT-4 держит пачку ксерокопий в кармане. Они давно привыкли продавать доступ к знаниям по подписке и теперь недовольны тем, что кто-то читает их тексты бесплатно и ещё делает это в промышленных масштабах.
OpenAI ведёт себя туманно — публичных объяснений минимум. Компания делает вид, что процесс обучения ИИ — это природное явление, где никто никому ничего не должен. Стороны спорят не о философии, а о деньгах. Контент стоит денег, модели зарабатывают деньги, а право пользоваться текстами — вдруг оказалось очень расплывчатым.
В этом конфликте есть привычный оттенок — издатели пытаются держаться за старую модель бизнеса, а технологи по дороге ломают всё, что не прикручено. Юридическая часть превращается в шоу, где обе стороны изображают обиженных. Но ставку делают на другое: кто первым закрепит правила игры для всего рынка.
В итоге спор выглядит не про память ИИ, а про власть над знаниями. Если выиграют издатели, доступ к данным станет дороже. Если победит OpenAI, у контент‑создателей заберут рычаги влияния. Остальным остаётся наблюдать — и гадать, кому именно принадлежит будущее знаний.