Коммерсантъ FM

FT: защитные механизмы систем ИИ можно легко обходить

Встроенные механизмы безопасности целого ряда систем ИИ, предлагаемых крупными технологическими компаниями, «за минуты» снимаются с помощью специального ПО. В результате пользователь легко может получить совет об эффективном применении химического оружия, сгенерировать изображения с насилием в отношении детей и т. д. Об этом сообщает Financial Times, проведшая соответствующее исследование совместно с группой по безопасности в сфере ИИ Alice.

Как утверждает газета, модели ИИ с открытым исходным кодом от Meta (признана экстремистской и запрещена в РФ) и Google были «в считаные минуты» модифицированы при помощи легкодоступного ПО. После этого они давали советы, как распылить отравляющее вещество в закрытом людном пространстве, сгенерировали код для похищения данных кредитных карт и написали рассказы с описанием насилия над детьми. На те же самые вопросы оригинальная ИИ-система отказывалась отвечать.

По мнению газеты, результаты исследования могут стать поводом для беспокойства относительно надежности разного рода защитных механизмов, предустанавливаемых создателями ИИ-систем, учитывая активное распространение систем с открытым исходным кодом.

«Если исторически (для отключения защитных механизмов.— “Ъ”) требовались знания и определенная настойчивость, то теперь это без труда может сделать и обычный человек»,— приводит газета слова Кэвина Этэяраджа, доцента по прикладному ИИ бизнес-школы Бута Чикагского университета.

Екатерина Наумова