Компания OpenAI объявила об усовершенствовании модели GPT-3.5 Turbo с помощью API. Новая функция позволяет обучать модель на пользовательских данных, таких как документы компании или проектная документация. В OpenAI утверждают, что в некоторых сценариях тонкая настройка модели может работать так же хорошо, как GPT-4, при меньших затратах.
Под тонкой настройкой в искусственном интеллекте понимается процесс взятия предварительно обученной нейронной сети (например, GPT-3.5 Turbo) и ее дальнейшего обучения на другом наборе данных (например, на пользовательской информации), который обычно меньше и связан с конкретной задачей. Этот процесс опирается на знания, полученные моделью на этапе первоначального обучения, и дорабатывает ее для конкретного применения.
Это может пригодиться, если специалисты хотят создать на базе GPT-3.5 ИИ-помощника, хорошо знакомого с определенным продуктом или услугой, но не имеющего об этом знаний в обучающих данных.
– С момента выпуска GPT-3.5 Turbo разработчики и компании просили предоставить им возможность настраивать модель для создания уникального и дифференцированного опыта для своих пользователей. С этим выпуском разработчики теперь могут выполнять тонкую настройку, чтобы сделать эту модель более эффективной для своих задач, – пишут специалисты OpenAI в корпоративном блоге.
OpenAI предлагает тонкую настройку 3.5 как способ получить производительность, подобную GPT-4, в конкретной области знаний при меньших затратах и более быстром времени выполнения.
– Ранние тесты показали, что тонко настроенная версия GPT-3.5 Turbo может соответствовать или даже превосходить базовые возможности уровня GPT-4 в некоторых узких задачах, – резюмируют специалисты.