谷歌Gemini Omni生成视频首曝

科学作者 June 2026年5月15日 21:25

AI生成的教授推导公式视频连步骤都对，这个细节值得和关注AI进展的同事一起看。

谷歌Gemini Omni生成视频首曝 事件脉络与关键事实

谷歌即将在I/O大会发布的全新多模态模型Gemini Omni，首次通过泄露演示引发全网关注。一段由AI生成的教授在黑板上推导三角恒等式的视频显示，模型不仅能准确呈现手写公式过程，还能同步语音讲解，文本一致性远超此前同类产品。该模型支持10秒、1280x720分辨率视频生成，并具备实时编辑能力，包括一键去水印和物体替换，光影与遮挡关系处理自然。与已关停的OpenAI Sora相比，Gemini Omni在逻辑连贯性和细节还原上展现出明显优势。

Gemini Omni被定位为原生多模态模型，深度集成于Gemini应用中，支持文本、图像、音频、视频的输入与输出。其ID为fbard_eac_video_generation_omni，提示词仅需一句即可生成高质量视频。测试显示，模型额度消耗较快，但生成质量极高，动漫风格视频也达到专业手绘水准。此次曝光时间点与Sora App停服仅隔两周，引发行业对AI视频赛道格局变化的猜测。

谷歌计划在I/O 2026主舞台上正式发布Gemini Omni及一系列新模型，包括Gemini 3 Flash、3.1全系及Lyria 3 Pro音频模型。此次泄露表明，谷歌正推动多模态AI在创作场景的深度应用。随着生成质量跨越‘恐怖谷’，AI视频正从视觉模拟迈向逻辑可信的新阶段，但高成本与用户留存仍是行业普遍挑战。

事实

谷歌全新视频模型Gemini Omni在I/O大会前曝光，支持10秒、1280x720分辨率视频生成
一段演示视频显示，AI生成的教授在黑板上正确推导三角恒等式，公式和讲解同步准确
Gemini Omni支持实时编辑功能，包括一键去水印和物体替换，画面无破绽
该模型仅用一句提示词即可生成高质量视频，ID为fbard_eac_video_generation_omni
OpenAI的Sora App已于2026年4月26日停服，API将于9月24日关闭
谷歌计划在2026年5月19日的I/O大会上正式发布Gemini Omni及系列新模型

Canto 的可视化新闻解读。制作过程可能有 AI 辅助。编辑政策

事实

谷歌推桌面版安卓系统

AI幻觉，能被数学解决吗？

苹果AI耳机H90首秀在即

Linux内核首个AI生成驱动上线

全球首部AI原生电影发布