
AI生成的教授推导公式视频连步骤都对,这个细节值得和关注AI进展的同事一起看。

谷歌Gemini Omni生成视频首曝 事件脉络与关键事实
谷歌即将在I/O大会发布的全新多模态模型Gemini Omni,首次通过泄露演示引发全网关注。一段由AI生成的教授在黑板上推导三角恒等式的视频显示,模型不仅能准确呈现手写公式过程,还能同步语音讲解,文本一致性远超此前同类产品。该模型支持10秒、1280x720分辨率视频生成,并具备实时编辑能力,包括一键去水印和物体替换,光影与遮挡关系处理自然。与已关停的OpenAI Sora相比,Gemini Omni在逻辑连贯性和细节还原上展现出明显优势。
Gemini Omni被定位为原生多模态模型,深度集成于Gemini应用中,支持文本、图像、音频、视频的输入与输出。其ID为fbard_eac_video_generation_omni,提示词仅需一句即可生成高质量视频。测试显示,模型额度消耗较快,但生成质量极高,动漫风格视频也达到专业手绘水准。此次曝光时间点与Sora App停服仅隔两周,引发行业对AI视频赛道格局变化的猜测。
谷歌计划在I/O 2026主舞台上正式发布Gemini Omni及一系列新模型,包括Gemini 3 Flash、3.1全系及Lyria 3 Pro音频模型。此次泄露表明,谷歌正推动多模态AI在创作场景的深度应用。随着生成质量跨越‘恐怖谷’,AI视频正从视觉模拟迈向逻辑可信的新阶段,但高成本与用户留存仍是行业普遍挑战。
事实
- 谷歌全新视频模型Gemini Omni在I/O大会前曝光,支持10秒、1280x720分辨率视频生成
- 一段演示视频显示,AI生成的教授在黑板上正确推导三角恒等式,公式和讲解同步准确
- Gemini Omni支持实时编辑功能,包括一键去水印和物体替换,画面无破绽
- 该模型仅用一句提示词即可生成高质量视频,ID为fbard_eac_video_generation_omni
- OpenAI的Sora App已于2026年4月26日停服,API将于9月24日关闭
- 谷歌计划在2026年5月19日的I/O大会上正式发布Gemini Omni及系列新模型
Canto 的可视化新闻解读。制作过程可能有 AI 辅助。 编辑政策





