В технологической индустрии набирает обороты тренд на «открытый исходный код» в сфере искусственного интеллекта. Многие компании называют себя приверженцами open-source политики, пытаясь повысить собственный авторитет.
Однако в сообществе нет единого мнения о том, что именно означает термин «открытый ИИ». На первый взгляд, он сулит будущее, где любой сможет участвовать в развитии этой революционной технологии. Это могло бы ускорить инновации и дать пользователям контроль над системами, способными изменить многие сферы жизни общества. Но что на самом деле делает модель ИИ открытой? Пока определение размыто, крупные игроки могут придумывать собственные трактовки, укрепляя и без того монопольные позиции.
Некоммерческая организация Open Source Initiative, самопровозглашенный арбитр в вопросах открытого исходного кода, является разработчиком широко признанного определения Open Source — свода правил, определяющих, можно ли считать то или иное ПО открытым. Организация собрала группу из 70 исследователей, юристов, политиков, активистов и представителей техногигантов, чтобы выработать аналогичные критерии для ИИ.
«Открытый код позволяет использовать, изучать, модифицировать и распространять программное обеспечение. Но для ИИ эти концепции не так очевидны. Основная проблема — многочисленные компоненты, входящие в модели: сама обученная модель, данные для обучения, код для препроцессинга, архитектура и прочее», — отмечает исполнительный директор OSI Стефано Маффулли.
Главный спорный момент, — какие именно компоненты алгоритма должны быть доступны. Сторонники строгого подхода настаивают, что без публикации обучающих данных модель автоматически нельзя называть открытой. Другие эксперты более лояльны — по их мнению, для осмысленной работы с моделью достаточно предоставить описание использованных данных, сами массивы публиковать необязательно.
Споры вокруг данных вполне объяснимы — это ключевое конкурентное преимущество крупных компаний, которые всегда неохотно им делятся. В то же время открытость несет выгоды: позитивный имидж, экономию на разработке за счет коллективного использования, формирование экосистем вокруг продуктов.
По данным Гарвардской школы бизнеса, благодаря использованию открытого программного обеспечения компании сэкономили около девяти триллионов за всю историю его существования. Открытый код позволяет создавать решения на базе качественных бесплатных разработок вместо того, чтобы писать все с нуля. Есть также указания, что модели открытого ИИ могут получить преференциальный режим регулирования.
Подводя предварительный итог дискуссии, Луис Вилья из Tidelift заявил: рано или поздно индустрия должна выработать единые правила игры, иначе определение монополизируют гиганты рынка, продиктовав условия в собственных интересах, и вместо обещанной открытости все получат ещё большую консолидацию власти в руках нескольких игроков.