基本信息
文件名称:AI视频生成技术能否成为“世界模拟器”.pdf
文件大小:1005.8 KB
总页数:3 页
更新时间:2025-06-24
总字数:约4.08千字
文档摘要

数字文化

DIGITALCULTURE

AI视频生成技术能否成为

“世界模拟器”?

清澈灵动的眼眸、活泼可爱的萌宠、神秘莫测的海底世界、熙熙攘攘的夏日街区、充

满科技感的魔幻都市……这些场景逼真、色彩丰富、氛围浓厚的短视频,现在都可以由人

工智能(AI)制作生成。2023年下半年开始,AI视频生成技术开始加速发展,如今,只

需输入一段文字,人们就能得到一段细节细腻逼真的视频。或许未来,AI视频生成技术

可以成为“世界模拟器”,为大众创造一个开放、包容且充满多样性的世界。

文王霜奉

随着人工智能技术的飞速发展,AI在视频诗如画的世外桃源。此外,短片中还展示了孙悟

生成领域的成就日益引人瞩目。近期,一名博主空驾舟渡海、来到城镇、前往灵台方寸山等精彩

利用AI技术创作了《西游记》动画短片,其精湛

的视觉效果立即引发了网友们的热议。这部短片

以《西游记》原著的第一集为创作蓝本,全长约

四分钟,生动描绘了石猴从降生到拜师学艺的精

彩过程。短片中,天庭的宫殿错落有致,熠熠生

辉,给人一种神秘而庄严的感觉。而花果山则是

一派宁静和谐的景象,郁郁葱葱的树木、飞流直

下的瀑布以及古朴典雅的石桥共同构成了一个如

48上海信息化

场景,令人叹为观止。如此精致

的短片在AI视频生成技术的加持

下,只需一周时间就能完成。

AI视频生成赛道具有很大的

商业潜力。数据显示,截至2023

年年底,仅我国短视频平台用户

规模就已突破10亿人。这些用

户中不乏有人很想尝试自媒体,

却无奈不会运用专业软件制作视

频。但随着AI视频生成技术的发

展,文本生成视频已经成为一种非常有用的工具。上实现向前或向后的无限扩展,比如给出一段视

2024年年初,该领域的新应用更是可以用“你方频,Sora就可以帮助补充前后剧情,剧情走向也

唱罢我登场”来形容。谷歌的GeminiPro1.5还没可以自由选择,基于同一个视频开头继续拓展,

出几个小时的风头,全世界的聚光灯就集中在可以延伸出不一样的结尾,或者是从不同的开头

了OpenAI的Sora身上。Sora是新型视频生成模引入,最终汇聚同一个结尾,还能像一些P图软件

型,它可以根据简短的文字提示(Prompt),将那样切换背景。Sora还具有视频拼接功能,将多

其转化为长达一分钟的高清视频,镜头质感堪比个毫无关系的画面“丝滑”地组合到一起。

电影。随着AI应用场景的不断拓展,AI视频生成

在OpenAI官方出具的技术报告中,对Sora的技术有望在许多领域发挥作用。对内容创作者来

定位为“作为世界模拟器的视频生成模型”,这说,仅通过输入文本就能生成高质量的视频,可

个模型的推出在业界得到很大反响,并不只是因以大幅减少制作时间、降低技术门槛,从而激发

为AI生成的视频时间更长、清晰度更高,而是生更多的创意灵感。依赖于Sora为代表的AI视频生

成了一个与真实物理世界相关的视频内容。无厘成模型,游戏领域也将实现突破。在未来的游戏

头的赛博朋克固然酷炫,但让真实世界中的一切里,只要言之所及,画面就能被渲染出来。因此

通过AI重现,显得更具意义。可以预计,在视频平台和游戏平台中,内容创作

以往的AI生成视频都是文本生成视频,者将会呈指数级增长。

但Sora还能接受其他类型的输入提示。比如,不过,AI视频创作日新月异的同时,不免引

“喂”给Sora一个小狗照片,它就能生成一段影起人们的隐忧。随着AI生成内容与现实之间的界

片,让小狗动起来。此外,Sora还能在时间维度限变得越来越模糊,如何确保内容的真实性和透