Лингвистический и статистический анализ статей свидетельствует о том, что генеративный искусственный интеллект используется для написания все большего количества научной литературы.
Исследование Эндрю Грея из Университетского колледжа Лондона (Великобритания), предполагает, что один процент всех статей, опубликованных в 2023 году, был хотя бы частично написан искусственным интеллектом. Еще одна работа, опубликованная командой Стэнфордского университета в США, утверждает, что эта цифра может составлять от 6% до 17,5% в зависимости от темы.
В обеих работах искались определенные слова, которые большие языковые модели (LLM) обычно используют, такие как intricate (сложный замысловатый), pivotal (ключевой), and meticulously (скрупулезно).
Отслеживая употребление этих слов в научной литературе и сравнивая их со словами, которые не пользуются особым предпочтением ИИ, авторы двух исследований утверждают, что они могут обнаружить растущую зависимость от машинного обучения в научном издательском сообществе.
В работе Грея использование таких контрольных слов, как red (красный), conclusion (вывод) и after (после), изменилось на несколько процентов с 2019 по 2023 год. То же самое происходило и с другими определенными прилагательными и наречиями вплоть до 2023 года.
Исследователи отметили, что авторы, публикующие больше препринтов, работающие в переполненных областях и пишущие короткие статьи, чаще используют ИИ. Авторы предполагают, что общая нехватка времени и необходимость писать как можно больше, стимулирует использование LLM, которые могут помочь увеличить объем выпускаемой продукции.
Использование ИИ для помощи в исследовательском процессе не является чем-то новым, и многие ученые открыто говорят об использовании ИИ для корректировки экспериментов с целью достижения лучших результатов. Однако использование ИИ для написания аннотаций и других частей статей – совсем другое дело.
Использование моделей искусственного интеллекта может быть очень рискованным, поскольку они часто создают неточный текст, а это как раз то, чего не должно быть в научной литературе.
Исследователи выразили обеспокоенность, написав, что использование генеративного ИИ в научной литературе может создать «риски для безопасности и независимости научной практики».