Главная страница / Читать / Новости / AMD представляет первую модель малого языка AMD-135M

AMD представляет первую модель малого языка AMD-135M

AMD представила первую малую языковую модель (SLM), AMD-135M, которая относится к семейству Llama и ориентирована на частный бизнес.

Дата публикации: Окт 01, 2024

По мере того как AMD наращивает свои мускулы в игре с искусственным интеллектом, она не только представляет новое оборудование, но и делает ставку на программное обеспечение, пытаясь занять новые сегменты рынка, в которых еще не доминирует Nvidia.

Новый релиз AMD выпускается в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code, каждая из которых предназначена для оптимизации конкретных задач путем ускорения производительности выводов за счет использования технологии спекулятивного декодирования.

Базовая модель, AMD-Llama-135M, была обучена с нуля на 670 миллиардах токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-полосных узлов AMD Instinct на базе MI250.

Кроме того, код AMD-Llama-135M был доработан с использованием дополнительных 20 миллиардов токенов, специально направленных на кодирование, и эта задача была решена за четыре дня с использованием того же оборудования.

AMD считает, что дальнейшие оптимизации могут привести к еще более высокой производительности. Эксперты оценивают появление AMD-135M, как явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели с использованием оборудования AMD для вывода.

Поделиться статьей в соц. сетях

Автор

Виктор Сапожников

Теги статьи

#AMD, искусственный интеллект

Оставайтесь на связи с ER10 Media! Вы можете найти нас в:

Интернет-издание о бизнесе, стартапах и IT-технологиях

AMD представляет первую модель малого языка AMD-135M

Добавить комментарий Отменить ответ