Теоретически, LLM должны быть умнее нас всех: они начитанны, обучены экспертами и уверены в себе. Но когда исследователи задали четырем популярным моделям 12 простых финансовых вопросов, результат оказался, мягко говоря, не очень.
Ах, если бы можно было просто спросить у Google: «Куда вложить деньги?» — и сразу разбогатеть. Увы, вместо золотых гор нас встречают километры рекламы, противоречивые сайты и ценные советы от «успешных успехов». Казалось бы, спасение рядом: большие языковые модели: ChatGPT, DeepSeek и многие другие. Уж они-то точно подскажут, какие акции пойдут вверх и когда криптовалюта взлетит ракетой. Но, как показало исследование, ИИ-модели пока не готовы давать дельные финансовые советы даже на бытовом уровне.
Исследователи искусственного интеллекта Гэри Смит, Валентина Либерман и Айзек Уоршоу из Центра естественного и искусственного интеллекта Уолтера Брэдли задали по 12 финансовых вопросов ведущим ИИ-моделям. Как оказалось, ни одна LLM не смогла правильно ответить даже на половину вопросов.
Итоги:
- ChatGPT — 5 баллов;
- DeepSeek — 4 балла;
- Grok — 3 балла;
- Gemini — 1,5 балла (полный провал).
Ошибки были поразительными: модели путались в простейших расчетах. Например, вопрос: стоит ли брать телевизор за $999,99 в рассрочку по $175,50 в месяц на год? Простая задача: явная переплата. Все четыре модели правильно посчитали итоговую сумму — $2 106, что на $1 106 дороже! Но ни одна не смогла рассчитать реальную годовую процентную ставку. А она, между прочим, превышает 200%! Модели проигнорировали переплату. Зачем напрягаться, ведь это не их деньги?
Покупка жилья? Все решили, что раз собственник не взимает арендную плату, значит дом — это сплошные расходы. Что ж, легко рассуждать, когда живешь на сервере и не платишь за коммунальные услуги.
В отличие от настоящих финансовых консультантов, которые учатся годами и ошибаются чуть реже синоптиков, LLM просто складывают слова в вероятные предложения. Их обучают общим правилам, но предсказать все нюансы реальной жизни они не способны.
Самое забавное — они делают это с такой непробиваемой уверенностью! Смайлики, восклицательные знаки, бодрый тон — все как у настоящего эксперта. Только вот за красивыми фразами часто скрывается пустота, как в роликах инфоцыган.
Вывод: не доверяйте ИИ свои деньги!