2024年02月20日
第12版:12

“王炸”模型Sora来了,自动生成的视频多角度且连贯流畅

根据一段文字 自动生成视频

“隆重介绍Sora,我们的文本转视频模型。”近日,美国一家人工智能研究公司突然发布首款文生视频模型——Sora。

这家公司在社交平台上发文,Sora可以创建长达60秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色。

Sora诞生让现实不存在了?

“这是我们的视频生成模型Sora,今天,我们开始为红队以及有限数量的创作者提供访问权限。”这家公司的创始人兼执行总裁山姆·阿尔特曼在社交媒体直言,真是不可思议。

目前这家公司在官网上已经更新了Sora生成的48个视频,这些视频不仅准确呈现出指令细节,还能理解物体在物理世界中的存在,并生成具有丰富情感的角色。该模型还可以根据提示、静止图像甚至填补现有视频中的缺失帧来生成视频。

令诸多网友热议的视频,是一只会撒娇的猫:一只猫试图叫醒熟睡的主人,要求吃早餐,主人试图忽略这只猫,但猫尝试了新招,最终主人从枕头下拿出藏起来的零食,让猫自己再多待一会儿。在这个人工智能生成视频里,猫甚至都学会了撒娇,对主人鼻头的触碰甚至都是轻轻的,接近物理世界里猫的真实反应。

但值得注意的是,在这则视频中也有一些小瑕疵:猫主人翻身的时候胳膊肘跟被子融为一体。

除了能够仅根据文字说明生成视频外,该模型还能根据现有的静态图像生成视频,并准确、细致地对图像内容进行动画处理。该模型还能提取现有视频,并对其进行扩展或填充缺失的帧。

“深度造假”将更进一步吗?

随着人工智能成为世界各地科技界的焦点,新工具Sora进一步引发了人们对深度造假的担忧:根据简单的文本提示生成高度逼真的60秒视频,这不大大提高了人工智能视频和已被用来欺骗民众“深度造假”内容的质量吗?

对此,这家公司发言人表示,这款名为“Sora”的新工具最初只会供一小部分艺术家和电影制作人以及“红队成员”或试图找到将人工智能工具用于恶意目的的人。

过去一年,人工智能生成的图像、音频和视频的质量迅速提高。与此同时,人工智能研究人员警告说,这些工具已经被用来欺骗民众。

人工智能专家和分析师表示,Sora视频的长度和质量超出了迄今为止所见的水平。

技术将带来行业落日?

技术的快速进步使得从电影制作到新闻行业等各个行业的人们都在争先恐后地了解它可能会对他们的工作产生怎样的影响。

在Sora诞生前,人工智能视频的工作流程都是单镜头单生成,在一个视频中,多角度且连贯流畅的自由切换,是无法想象的。“不管多么悲伤和恐惧,这就是所有工作的未来。”某电影后期制作人告诉记者,技术的进步是不会止步的,不能更不会因为我们预感未来它可能取代我们的工作而停止。“对于行业来说也是好事,技术进步意味着我们能制作出更精良的影视作品,告别‘5毛’特效。”

人工智能视频生成器已在好莱坞引起了轰动。制作电影成本高昂、耗时,并且需要数十或数百人。一些技术专家推测,人工智能可以让一个人制作出与漫威大片具有相同视觉复杂性的电影。

电影导演兼视觉效果专家迈克尔·格雷西一直密切关注人工智能对行业的影响。格雷西预测,很快,像Sora这样的人工智能工具将允许电影制作者仔细控制他们的输出,从头开始创建各种视频。“当技术剥夺了其他人的创造力、工作、想法和执行力,却没有给予他们应有的荣誉和经济报酬时,不是一件好事情。”

Sora视频的质量,尤其是那些看起来像现实生活的视频,比大多数其他人工智能公司迄今为止能够制作的质量要高。普林斯顿大学一位计算机科学教授表示,根据发布的视频,Sora“似乎比任何其他视频生成工具都“先进得多”。他表示,“这可能会导致‘深度伪造’视频,人们更难识别出人工智能生成的视频。” 据封面新闻

2024-02-20 “王炸”模型Sora来了,自动生成的视频多角度且连贯流畅 2 2 沧州晚报 content_119317.html 1 根据一段文字 自动生成视频 /enpproperty-->