
blog.google
Introducing Gemini Omni - Google
Gemini Omni allows you to create anything from any input and edit naturally using conversational language.
2026年5月20日,Google I/O 上发布的 Gemini Omni 将视频创作入口从「描述一个画面」变成了「给我你手上有的任何东西」——图片、视频片段、文字、声音皆可混合输入,物理直觉内化于模型,对话式多轮编辑取代了「重新生成」。文章拆解其全媒体输入设计、渐进式编辑体验和 SynthID 水印策略背后的产品逻辑。
「把背景换成夜晚的城市」→「镜头从左边推进」→「给主角加一件外套」

Gemini Omni allows you to create anything from any input and edit naturally using conversational language.
このコンテンツについて、さらに観点や背景を補足しましょう。