Казахстан разрабатывает собственную большую языковую модель (LLM) модель, которая станет основой для аналога СhatGPT. По словам главы МЦРИАП РК Жаслана Мадиева, запуск чат-бота может состояться к концу 2024 года.
«Собирается корпус казахского языка и слова в оригинале на казахском языке. Плюс через различные инструменты переводятся качественные тексты – с русского и английского языков. Это все вместе объединяется, токенизируется и на этой основе будет периодически тренироваться модель», – рассказывает Жаслан Мадиев.
По словам главы ведомства, проект получил финансирование и необходимые вычислительные мощности.
«Мы были этим удивлены, что есть спонсоры, которые готовы участвовать в этом большом проекте. И переживают за появление отечественных LLM и ChatGPT, поэтому сейчас я не могу назвать, сколько государство на это тратит. Но в принципе – это те трудовые затраты и ресурсы, которое государство тратит в виде зарплат сотрудников. Это те инженеры, которые тренируются на этом, получают опыт, – отметил Мадиев.
Министр заявил, что казахский GPT можно будет применять на других платформах, таких как Яндекс и Google. Жаслан Мадиев считает, казахский GPT должен быть в открытом доступе, а пользоваться его возможностями смогут все желающие.