В эти дни в Лас-Вегасе проходит Google Cloud Next 2024, в рамках которой технологический гигант представил множество новинок. Мы отобрали самые интересные из них.
Gemini 1.5 Pro
Gemini 1.5 Pro в Google называют одной из самых мощных генеративных моделей искусственного интеллекта. Инструмент теперь умеет использовать в работе текст, изображения, аудио, видео и код. Объем токенов увеличился до 1 млн. В Google утверждают, что Gemini 1.5 Pro способен, например, понимать, рассуждать и выявлять любопытные детали в 402-страничных записях полета "Аполлона-11" на Луну.
Google Vids
ИИ-модель Google Vids, добавленная в Google Workspace – это нейросеть позволяющая создавать видеоролики. Инструмент имеет функции редактирования, записи и продакшн. Также есть возможность сотрудничества с коллегами в режиме реального времени в Google Vids.
Gemini Code Assist
Новый ИИ-инструмент помогает в завершении кода и оказания помощи программистам. Google ранее предлагал аналогичный сервис под ныне несуществующим брендом Duet AI. Как сообщается, новая модель обладает более богатым функционалом и продвинутыми возможностями.
Дополнительные ИИ-функции Google Workspace
В популярный инструмент Google Workspace добавлены новые возможности на основе ИИ. Например, ИИ-функция Help me write поможет превратить любой черновик в красивое письмо, а дополнение AI meetings and messaging сделает заметки, предоставит выдержки собраний и переведет контент на 69 языков. Обновления также получили приложения Sheets и Drive.
Vertex AI Agent Builder
Инструмент Vertex AI Agent Builder помогает быстро и легко и развертывать готовых к работе диалоговых агентов на базе искусственного интеллекта, инструктировать их и направлять в работе. Модель использует в работе процесс «обоснования», когда ответы привязаны надежным источникам. В данном случае он полагается на поиск Google.
Инструменты с открытым кодом
Также были представлены инструменты с открытым исходным кодом, предназначенные для поддержки проектов и инфраструктуры генеративного ИИ. Один из них – Max Diffusion, представляющий собой коллекцию эталонных реализаций различных моделей диффузии, которые работают на устройствах XLA.
Еще две новинки – движок для запуска генеративных моделей ИИ Jetstream и коллекция ИИ-моделей, генерирующих текст MaxTest, ориентированная на облачные TPU и GPU Nvidia.
Imagen 2
Инструмент Imagen 2 – мощный генератор изображений, встроенный в Gemini. ИИ-модель теперь способна создавать не только картинки, но и «живые» изображения – 4-секундные ролики.