Компания Microsoft представила BitNet b1.58 2B4T – новый тип LLM, разработанный для исключительной эффективности. ИИ-модели необходимо всего 400 МБ памяти и не нужен GPU.
В отличие от обычных моделей ИИ, которые используют 16- или 32-битные числа с плавающей точкой для представления каждого веса, BitNet использует только три дискретных значения: -1, 0 или +1.
В результате модель значительно сокращает потребление памяти и может работать на стандартном оборудовании, не требуя высокопроизводительных графических процессоров, обычно необходимых для крупномасштабного ИИ.
Модель BitNet b1.58 2B4T была разработана группой общего искусственного интеллекта Microsoft и содержит два миллиарда параметров – внутренних значений, которые позволяют модели понимать и генерировать язык. Модель была обучена на огромном наборе данных из четырех триллионов лексем, что примерно эквивалентно содержанию 33 миллионов книг. Такое обширное обучение позволяет BitNet достойно конкурировать с Llama 3.2 1B, Gemma 3 1B и Qwen 2.5 1.5B.
В эталонных тестах BitNet b1.58 2B4T продемонстрировал высокую производительность в различных задачах, включая математические задачи для школьников и вопросы, требующие рассуждений на основе здравого смысла. В некоторых оценках он даже превзошел своих конкурентов.