Gemini Omni Flash 在 Google I/O 后带来了很高的搜索热度,但当前最重要的事实是:Omni Flash API 尚未面向开发者普遍开放。
Gemini Omni 把体验拆成三个清晰工具:提示词优化、AI 图片生成和 AI 视频生成。
当前可用能力
- Gemini Flash 可以把粗略想法改写成高质量英文生成 Prompt。
- AI Image Generator 支持 Text to Image 和 Image to Image。
- Gemini Omni Video Generator 支持 Text to Video、Image to Video 和 Reference to Video。
还不可用的能力
缺失的是官方 Omni Flash API,以及围绕视频输出进行原生多模态对话编辑的能力。在这之前,产品不应该承诺“完全等同官方 Omni Flash”。
推荐工作流
先输入创意,再优化成英文 Prompt;需要视觉控制时先生成或编辑图片,然后再用文字、图片或参考视频生成 Gemini Omni 视频。

