Интернет-издание о бизнесе, стартапах и IT-технологиях

Популярные теги:
Главная страница / Читать / Новости / Чем умнее становится ИИ, тем лучше он жульничает

Чем умнее становится ИИ, тем лучше он жульничает

Чем умнее становится ИИ, тем лучше он жульничает

Чем более совершенными становятся ИИ-модели, тем они больше склонны к жульничеству. Особенно это касается вопросов соперничества.

Недавнее исследование группы, изучающей безопасность и этику ИИ Palisade Research, выявило тревожную тенденцию: новые модели ИИ могут самостоятельно находить и использовать слабые места в кибербезопасности, обходя защиту и задействуя короткие пути для выполнения задач, даже если технически им это не разрешено.

Команда выстроила семь лучших больших языковых моделей против шахматного симулятора Stockfish, который ставит в тупик гроссмейстеров с 2014 года. Столкнувшись с невозможностью одолеть противника честно, но решив победить, модель o1 от OpenAI и R1 от DeepSeek приступили к манипуляциям с системными файлами, чтобы изменить положение своих фигур на доске.

Исследователи попросили каждую модель объяснить, чем она руководствуется при каждом ходе. Согласно «словам» o1, ее задача заключается в одолении симулятора Stockfish. А вот о том, что победа должна быть честной, модель, якобы, инструкций не получала.

Эта логика, очевидно, привела к тому, что o1 пыталась жульничать 37% времени, выиграв 6% игр. R1 также пыталась хитрить 11% времени, но так и не смогла найти подходящую уловку, способную привести ее к победе.

В другом недавнем исследовании группа ученых обнаружила, что o1 постоянно занимается обманом. Модель не только могла лгать исследователям без предупреждения, но и активно манипулировала ответами на базовые математические вопросы, чтобы избежать завершения теста, демонстрируя хитроумную способность к самосохранению.

– Подобные исследования подчеркивают переменчивую этику развития ИИ и необходимость контроля над его быстрым прогрессом, – говорит исполнительный директор Palisade Джеффри Ладиш. – Обучая модели и подкрепляя их за решение сложных задач, вы приучаете их быть неумолимыми. Очень важно, чтобы разработчики ИИ ставили во главу угла безопасность, а не скорость исследований.

Поделиться статьей в соц. сетях

Share on telegram
Share on twitter
Share on facebook
Share on whatsapp

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *