Парадокс искусственного интеллекта: могут ли ИИ и open source сосуществовать?

Следите за новостями по этой теме!

Подписаться на «Рифы и пачки / Твоя культура»

17.09.2025, 10:35:04ИТОбщество✮✮✮✮✮✮✮

Open source (открытое программное обеспечение) традиционно строится на принципах прозрачности и коллективной работы. Каждый может изучить, использовать или улучшить такой код, а также участники часто обязаны указывать авторов исходного продукта. На этой открытости зиждется целая экосистема со своими лицензиями и правилами.

В противоположность этому, современные искусственные интеллекты — например, помощники-программисты — обычно являются закрытыми, собственническими разработками крупных компаний. Их не поймёшь: модель учится на миллионах строк кода (и часто это то же open source), но результат её "творчества" — скрытая смесь чужих решений, без указания первоисточников. Как отмечают исследователи Snyk, такая непрозрачность способна привести к непреднамеренным нарушениям лицензий, потому что ИИ может слепить новый кусок кода из всего, что когда-либо видел.

Open source основан на совместном владении и быстром обмене обновлениями, включая патчи безопасности. А вот с ИИ с этим не так: если машина сгенерировала код с багом, часто нельзя легко отследить его появление или быстро исправить.

Компании, разрабатывающие ИИ, не спешат делиться своими моделями и наборами данных, оправдываясь защитой коммерческих интересов. Это идёт вразрез с философией open source, и часть FOSS-сообщества (Free and Open Source Software — движение за свободное ПО) воспринимает такое "вторжение" искусственного интеллекта как угрозу — ИИ заимствует open source-код, не сохраняя духа и буквы открытости.

Тем не менее, обе стороны переплетены тесно: ИИ-модели буквально построены на основании открытых репозиториев GitHub — среднее приложение сейчас на 70% состоит из компонента open source. Это создаёт новую проблему: если исходный open source-код уже содержит уязвимости, то ИИ перенимает и их.

Согласно отчёту Snyk за 2023 год, больше половины разработчиков говорят, что сталкивались с небезопасным кодом, сгенерированным ИИ: алгоритм повторяет ошибки, уже "заложенные" в обучающих данных. Получается, что ИИ, как великан на плечах гигантов, несёт не только достоинства open source, но и его недостатки, включая требования по лицензированию.

Что делать? Нужны стратегии, которые сочетают скорость и мощь ИИ с прозрачностью и юридической определённостью open source. Оба направления мотивируют разработчиков делиться знаниями и ускоряют развитие технологий. Но взаимное доверие и ответственность становятся обязательными: ИИ-помощники должны проверять лицензии и ловить уязвимости ещё на этапе генерации кода. Разработчики обязаны относиться к результату работы машины так же, как к неизвестному коду из интернета.

Техническое сообщество создаёт инструменты, которые сравнивают сгенерированные нейросетями фрагменты с публичными репозиториями, чтобы заранее оценить риски нарушения лицензий. Лучший способ исключить эти риски — обучать ИИ только на коде с разрешительными лицензиями или из общественного достояния, минимизируя вероятность потери авторских прав.

Компании и open source-сообщества разрабатывают чёткие политики: кому и как можно использовать код, сгенерированный ИИ, когда требуется предварительная проверка или согласование таких изменений, и почему важно регулярно обучать разработчиков распознавать угрозы и преимущества генеративных моделей.

Есть и вопросы безопасности: какой код вы "кормите" ИИ-помощнику, и не окажется ли он в открытом доступе для других? Лучше держать личные и коммерческие секреты подальше от сторонних нейросетей.

Будущее — в синтезе: принципы open source становятся частью этики искусственного интеллекта, а для ИИ доверие — единственный путь к успеху. Грамотный баланс между скоростью машин и человеческой ответственностью позволяет ускорять инновации, не теряя ценностей открытого сообщества.

perec.ru

ИИ теперь копается в open source-грядке, словно в помойке с объявлениями — берёт всё, не спрашивая разрешения. Разработчики из года в год тянули лямку прозрачности и лицензирования, а в XXI веке выясняется, что можно было просто написать нейросеть, прогнать скрипт и не знать, откуда взялся код — прекрасно. Классика: компании дорожат тайнами, подводят идеологию «безопасности», а в это время бесплатный труд программистов растворяется внутри очередной нейросети. Дошло до абсурда — ИИ унаследовал баги и дыры от open source, а виноват никто. Ко всему прочему, теперь программистам—живым приходится заново изучать, как отличить свое от машинного. Сделаем всё по уму? Проверяем лицензии, не даём ИИ кушать личные данные, код проверяем, как последнюю сигарету в пачке — внимательно и трижды. Доверия — кот наплакал. Никто не удивлён, все продолжают играть.