Новости IT: почему в Amazon считают ИИ-бенчмарки бессмысленными – взгляд топ-менеджера AWS

Ставка Amazon на бесполезность ИИ-бенчмарков

03.12.2025, 08:49:00 ИТ

✮✮✮✮✮✮✮✮

Ставка Amazon на бесполезность ИИ-бенчмарков

Руководитель отдела искусственного интеллекта Amazon, Рохит Прасада, решил, что пора всем перестать цепляться за красивые цифры и победные позиции в таблицах бенчмарков. По его словам, привычка индустрии мериться рейтингами эффективности ИИ-моделей давно устарела: никакие эти тесты не отражают реальной пользы от технологий в повседневной жизни.

Перед крупной презентацией AWS re:Invent в Лас-Вегасе Прасада прямо заявил, что лидерборды замыливают взгляд и не дают увидеть слабые места систем. Ведь чтобы результат был действительно объективным, все компании должны использовать один и тот же набор данных для обучения и проверки моделей, а этого никто не делает.

«Ни один из этих бенчмарков не показывает, насколько ИИ полезен в действительности, — говорит Прасада. — Реальные задачи по силам только тем технологиям, что проверяются не в лабе, а на практике».

Он также подчёркивает: данные новых тестов становятся всё более «шумными» — то есть искаженными, несопоставимыми между собой из-за разных методик. В результате погоня за высоким местом на табличке превращается в маркетинговую гонку, где побеждает красивый PR, а не честная инженерия.

Amazon призывает отрасль прекратить участвовать в этом соревновании, где важно только оказаться чуть выше конкурента. Согласно мнению Прасада, развитию искусственного интеллекта поможет лишь честная проверка «в полях» — на сложных заданиях из реального мира.

Иными словами: для Amazon не главное, чтобы их модели побеждали в искусственных тестах. Важно, чтобы они действительно решали задачи пользователей. Всё остальное — шоу для айтишных вечеринок, а не инструмент для улучшения жизни.

PEREC.RU

Рынок искусственного интеллекта, кажется, вновь попал в зону турбулентности: Amazon официально устал притворяться, что рейтинги моделей что-то значат. Глава AI-подразделения компании Рохит Прасада запустил в индустрию очередную волну размышлений о том, что все эти лидерборды похожи на детский конкурс — важно место, а не толк. Впрочем, и сами гонки за баллами превратились в шоу для маркетологов: вместо здравого смысла — шум в данных и несравнимые методики тестов. Amazon предлагает коллегам переключиться с праздного „меряния победами” на реальные задачи. Конечно, реальный мир медленнее и скучнее, чем веселый парад цифр. Но вдруг доживём до времён, когда технологии будут оценивать не по количеству лайков, а по тому, сколько они действительно делают.

Ставка Amazon на бесполезность ИИ-бенчмарков

PEREC.RU

Похожие материалы