Gemini Omni Полный разбор (Markdown)

Назад к разбору модели

Gemini Omni API Руководство по модели

Краткий вывод

  • Позиционируется как Flash-модель для быстрой генерации, низкой задержки и частых итераций.
  • Подходит для прототипирования, коротких роликов для соцсетей и пакетной генерации без тяжелого production-процесса.
  • Работает через асинхронные видеозадачи: сначала отправка, затем опрос статуса.

Ключевые возможности

  • Низкая задержка:Подходит для сценариев, где нужно быстро увидеть результат и часто менять промпт.
  • Пакетная генерация коротких видео:Удобно для коротких роликов, много-вариантных тестов и соцсетевых креативов.
  • Единый контракт видеозадач:Использует общий video task interface ToAPIs для более простого перехода в production.

Когда использовать

  • Когда нужно быстро проверить идею, сценарий или визуальное направление.
  • Когда требуется пакетная генерация коротких роликов для соцсетей или нескольких вариантов креатива.
  • Когда важна низкая задержка для частых итераций промптов.

Когда не использовать

  • Когда приоритетом является showcase-качество и максимально стабильная картинка.
  • Когда нужен синхронный немедленный ответ, а не асинхронный task workflow.

Особенности работы

  • Работает как асинхронная видеозадача: сначала возвращает статус задачи, а не сам видеофайл.
  • Лучше всего подходит для коротких длительностей, быстрого фидбэка и многократной настройки параметров.
  • Легко встраивается в серверные очереди и production-процессы через общий polling workflow.

Минимальный запрос

{
  "model": "gemini_omni",
  "prompt": "Кинематографичный кадр: кошка бежит по неоновому дождливому городу",
  "aspect_ratio": "16:9",
  "duration": 6,
  "resolution": "720P"
}

Минимальный ответ

{
  "id": "video_01JZEXAMPLE",
  "object": "generation.task",
  "model": "gemini_omni",
  "status": "queued",
  "created_at": 1779247407
}

Ключевые параметры

ПараметрТипОбяз.По умолчаниюДиапазонОписание
modelstringДаgemini_omni-Идентификатор модели; фиксированное значение gemini_omni.
promptstringДа--Основная инструкция для объекта, действия, сцены и визуального стиля видео.
aspect_ratiostringНет16:916:99:16
durationintegerНет6610
resolutionstringНет720P720PРазрешение результата; сейчас поддерживается только 720P, если поле не передано, используется значение по умолчанию.

Частые ошибки

HTTPCodeТриггерИсправлениеПовтор
400invalid_request_errorВ payload отсутствуют обязательные поля или типы полей неверны.Проверьте схему model, mode и input перед отправкой.Повторяйте только после исправления payload; избегайте слепых ретраев.
401authentication_errorОтсутствует заголовок Authorization или API Key недействителен.Проверьте формат Bearer token и права API key.Повторите после исправления авторизации; при повторяющихся сбоях замените ключ.
429rate_limit_exceededЧастота запросов, параллелизм или квота упираются в upstream rate limiting.Сначала примените exponential backoff, затем проверьте частоту, параллелизм и квоту.Используйте exponential backoff с jitter; при повторении снизьте нагрузку.
500internal_errorКратковременный сбой upstream-сервиса или внутренняя ошибка обработки.Сохраните request id и запустите retry workflow.Повторите 2-3 раза с короткой задержкой; при постоянной ошибке эскалируйте.

FAQ

  1. Для каких сценариев лучше всего подходит Gemini Omni?
    Лучше всего подходит для прототипирования, коротких видео для соцсетей, пакетной генерации и быстрых креативных итераций с низкой задержкой.
  2. Ошибка у модели изображений или видео: invalid apitype: -1
    Обычно это означает, что запрос отправлен не в тот endpoint. Модели изображений и видео обычно не используют chat endpoint. Вместо этого нужно отправлять HTTP-запрос на создание задачи по документации и затем опрашивать endpoint статуса задачи. Сначала проверьте фактический код запроса, URL и payload.
  3. Задача на генерацию изображения или видео завершилась ошибкой, но списание произошло
    Сначала попросите у пользователя лог задачи или скриншот и проверьте, есть ли там статистика входных или выходных токенов. Если учет токенов есть, запрос, скорее всего, был отправлен через chat endpoint, а не через правильный media workflow. Модели изображений и видео обычно работают как асинхронные HTTP task API: сначала отправляется задача, затем выполняется опрос по task id согласно документации.

Связанные API