烟台日报电子报刊

日	一	二	三	四	五	六

2024年02月21日

第A11版：文化视点

文生视频效果“炸裂” 未来扔一部小说出一部大片？

扔进去一段文字，分分钟生成“大片”级别的视频内容？近日，OpenAI发布首个视频生成模型Sora，随即引发人们关注。
在短视频流行的今天，这意味着什么？又将带来哪些影响？
AI生成视频效果“炸裂”
几只巨大的毛茸茸的猛犸象踏着白雪皑皑的草地走来、一个毛茸茸的小怪物跪在融化的红蜡烛旁边、女子在街头漫步……OpenAI称，这些几乎可以乱真的视频均由Sora直接生成，未经修改。
Sora能否改变影视行业？

只要输入一句或寥寥几句描述画面情节的提示词，文生视频大模型Sora就能生成一段时长60秒的视频。这些视频的质量和准确性达到了令人惊艳的程度。
Sora的技术原理是什么？其应用价值有多大？记者采访了上海交通大学计算机科学与工程系教授赵海。
赵海教授介绍，Sora属于多模态混合模型，由大语言模型和文图生成器拼接而成。纯文图生成模型对提示词的理解能力很弱。比如，用户输入“世界和平”，它往往无法生成准确的图片。如果把文图生成器与大语言模型拼接在一起，后者就能把“世界和平”转化为和平鸽、橄榄枝等文图生成器“看得懂”的提示词，从而生成切题的作品。

上一版下一版