|
|
|
| 日 | 一 | 二 | 三 | 四 | 五 | 六 |
|---|
第A11版:文化视点
扔进去一段文字,分分钟生成“大片”级别的视频内容?近日,OpenAI发布首个视频生成模型Sora,随即引发人们关注。
在短视频流行的今天,这意味着什么?又将带来哪些影响?
AI生成视频效果“炸裂”
几只巨大的毛茸茸的猛犸象踏着白雪皑皑的草地走来、一个毛茸茸的小怪物跪在融化的红蜡烛旁边、女子在街头漫步……OpenAI称,这些几乎可以乱真的视频均由Sora直接生成,未经修改。
只要输入一句或寥寥几句描述画面情节的提示词,文生视频大模型Sora就能生成一段时长60秒的视频。这些视频的质量和准确性达到了令人惊艳的程度。
Sora的技术原理是什么?其应用价值有多大?记者采访了上海交通大学计算机科学与工程系教授赵海。
赵海教授介绍,Sora属于多模态混合模型,由大语言模型和文图生成器拼接而成。纯文图生成模型对提示词的理解能力很弱。比如,用户输入“世界和平”,它往往无法生成准确的图片。如果把文图生成器与大语言模型拼接在一起,后者就能把“世界和平”转化为和平鸽、橄榄枝等文图生成器“看得懂”的提示词,从而生成切题的作品。