Gemini Omni Flash API 状态：开发者今天能用什么

2026/05/23

目录

当前可用能力还不可用的能力推荐工作流

Gemini Omni Flash 在 Google I/O 后带来了很高的搜索热度，但当前最重要的事实是：Omni Flash API 尚未面向开发者普遍开放。

Gemini Omni 把体验拆成三个清晰工具：提示词优化、AI 图片生成和 AI 视频生成。

当前可用能力

Gemini Flash 可以把粗略想法改写成高质量英文生成 Prompt。
AI Image Generator 支持 Text to Image 和 Image to Image。
Gemini Omni Video Generator 支持 Text to Video、Image to Video 和 Reference to Video。

还不可用的能力

缺失的是官方 Omni Flash API，以及围绕视频输出进行原生多模态对话编辑的能力。在这之前，产品不应该承诺“完全等同官方 Omni Flash”。

推荐工作流

先输入创意，再优化成英文 Prompt；需要视觉控制时先生成或编辑图片，然后再用文字、图片或参考视频生成 Gemini Omni 视频。

Gemini Omni

Gemini Omni Flash API 状态：开发者今天能用什么 | Omni Flash 指南与教程