Технології

Google представила бюджетну AI-модель Gemini 3.1 Flash-Lite для швидких і масштабних задач

Ставка на швидкість і низьку ціну

Google розширює лінійку власних моделей штучного інтелекту Gemini. Компанія презентувала Gemini 3.1 Flash-Lite – найекономнішу модель у серії Gemini 3, створену для швидкої роботи та обробки великих обсягів завдань.

Новинка орієнтована насамперед на розробників, яким потрібні масштабовані інструменти з мінімальною затримкою відповіді та низькою вартістю використання.

У Google наголошують, що Flash-Lite розроблена для високочастотних робочих процесів, де важлива оперативність генерації результатів. Модель оптимізована для автоматизованих систем, які працюють із великими обсягами даних і потребують швидкої реакції.

Вартість використання сервісу залишається однією з головних переваг нової моделі. Обробка одного мільйона вхідних токенів коштує $0,25, тоді як генерація одного мільйона вихідних токенів обійдеться у $1,50.

Google представила бюджетну AI-модель Gemini 3.1 Flash-Lite для швидких і масштабних задач

За результатами бенчмарку Artificial Analysis, Gemini 3.1 Flash-Lite демонструє значно швидший старт генерації відповіді. Показник Time to First Answer Token у неї приблизно у 2,5 раза швидший порівняно з моделлю 2.5 Flash.

Крім того, швидкість створення тексту збільшилася на 45%, при цьому якість відповідей зберігається на подібному або навіть кращому рівні.

У рейтингу Arena.ai Leaderboard нова модель отримала оцінку Elo 1432. Під час спеціалізованих тестувань вона показала конкурентні результати:

  • 86,9% у тесті GPQA Diamond
  • 76,8% у MMMU Pro

За цими показниками Flash-Lite змогла випередити низку моделей того ж класу і навіть деякі більші системи попередніх поколінь.

У Google позиціонують Gemini 3.1 Flash-Lite як інструмент для масштабних та регулярних операцій, де важлива швидкість обробки і економічність.

Зокрема, модель може застосовуватися для:

  • масового перекладу текстів
  • модерації контенту
  • класифікації даних
  • аналізу великих кодових баз
  • виконання масштабних мультимодальних завдань

Наразі Gemini 3.1 Flash-Lite уже доступна в режимі preview. Розробники можуть протестувати її через Gemini API у середовищі Google AI Studio, а корпоративні клієнти – через платформу Vertex AI.

Таким чином Google робить ставку на більш доступні та швидкі AI-моделі, які можуть обслуговувати масові робочі процеси без значних витрат на обчислення.

Поділитися:
Показати коментарі (0)
Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *