Исследователи искусственного интеллекта из Стэнфорда и Университета Вашингтона смогли обучить «рассуждающую» ИИ-модель, потратив на это менее $50 в виде кредитов на облачные вычисления.
Модель s1, демонстрирует схожие с OpenAI's o1 и DeepSeek's R1 результаты в тестах, измеряющих способности к математике и кодированию. Модель s1 доступна на GitHub вместе с данными и кодом, использованными для ее обучения.
Команда, создавшая s1, заявила, что запустила готовую базовую модель, а затем доработала ее с помощью дистилляции – процесса извлечения «логических» возможностей из другой модели ИИ путём обучения на её ответах.
По словам исследователей, модель s1 была получена из одной из моделей рассуждений Google, Gemini 2.0 Flash Thinking Experimental.
Исследователи, создавшие s1, стремились найти самый простой подход для достижения высокой производительности рассуждений и масштабирования по времени тестирования, то есть для того, чтобы ИИ-модель могла больше думать, прежде чем ответить на вопрос. Это было одним из достижений o1 от OpenAI, которые DeepSeek и другие лаборатории ИИ пытались повторить с помощью различных методов.