曾经制作诡异视频的AI,居然这么快就"以假乱真"了?

2024/2/228 浏览综合
“知道AI进化的速度快,但没想到它能进化得这么快。”
一年前,一段 “威尔史密斯吃面”的视频在互联网上疯传。
那时候大家都把这回事儿当做乐子来谈,因为AI生成的视频实在是过于诡异和无厘头,很难和现实联系在一起,更别提运用到实际生活上了。
TapTap
但AI进步的速度似乎超出我们的想象——
一年后,AI带着能够以假乱真的视频,再一次刷新了我们的认知上限。
TapTap
你没看错,真是AI生成的
相信这两天,大伙们都已经刷到过不少类似上面的AI视频了。
就在2月16号,OpenAI旗下一个名为“Sora”的AI生成视频模型开启了内测。和“文生图”的方式一样,只要你输入一段介绍,Sora就能给你生成一段时长60秒的视频。
TapTap
“Sora”在日语中意为“天空”
其实早在Sora推出之前,就有不少厂商在研究AI视频模型了。像是meta推出的“make a video”,stable diffusion他们家的stable video,最近还有谷歌的推出Lumiere。
TapTap
谷歌Lumiere生成的视频
虽说各家的AI视频在打磨下也都变得越来越成熟吧,但Sora的出现,还是给这些AI视频模型来了次实打实的“降维打击”。
你看,这些视频中关于人物精度和场景设计的表现,如果不说是AI制作的,我还真以为是某个电影的片段;
TapTap
TapTap
在这几个视频中,物体运动轨迹和碰撞效果的逼真程度,都真实到让我不敢相信自己的眼睛。
TapTap
TapTap
最绝的是Sora生成的风景视频,从画面上看几乎没有一处不合理的地方,让人以为是现实中航拍画面。
TapTap
甚至Sora还能够生成游戏的实时画面,在玩家主视角运动的同时,还能够同步生成游戏世界的动态变化,真的太神奇了。
TapTap
虽然这只猪看着有点怪
当然,逼真归逼真,如果你仔细看,其实还是能够通过各种细节“鉴AI”的,例如背景版上如乱码一般的字符,以及视频中突然出现的不符合逻辑的画面。看来至少到现在为止,我们还能勉强分清现实和虚拟的区别。
TapTap
TapTap
就在Sora生成的视频刷爆网络的时候,互联网上突然出现了一段关于“史密斯吃面”的对比视频。在一年前的对比下,一年后AI生成的视频已经有了质的飞跃。
TapTap
不过实际的情况有点乐——其实下面这个视频并不是由AI制作的,而是威尔史密斯本人亲自拍摄的吃面过程。
TapTap
自己给自己整了个活
虽说是个乐子吧,但仔细想想还真觉得有些毛骨悚然,因为:
我们现在好像真的很难分清现实和虚拟的界限了。
TapTap
推特的评论
这种模糊的边界感,首先就体现在了互联网上。
不知道是从谁开始的,自从Sora公布之后,推特上兴起了一场“以真乱假”的整活狂欢。
网友们会在推文中来上一句“这个视频是由Sora生成的” (This video was generated by Sora),在加上模仿AI生成视频所用到的提示词。
这些视频通常是一些现实生活中比较荒谬的行为,而这种无厘头刚好可以和满足任何需求的AI挂上钩。
TapTap
“在酒吧顶着啤酒跳舞”
当然还有些电影的情节。不得不说,有的奇葩电影剧情真的天马行空,离谱到连AI都自愧不如。
TapTap
如果不是看过这个电影解说,我就真信了
甚至还有的抽象视频,再配上更为抽象的文字,还真有种 “AI生成的美感”。
TapTap
整活归整活,随着“假装AI”的狂欢越闹越大,也有不少网友产生了一些担忧——当Sora公测之后,这些AI视频大量投入到互联网,以后我们该怎么分辨真假呢?
TapTap
TapTap
我想了想,好像还真的挺难的。
且不提如今真实性极强的Sora,就连之前出现的AI技术也变得越来越“以假乱真”了。
还记得去年4月份,互联网上就有诈骗份子利用AI换脸、AI声音技术骗到人的消息。而随着时间的推移,这些只会被打磨的越来越成熟,难以被人分辨。
TapTap
例如上周我就在B站上刷到了一位UP用AI声音“复活”敖厂长的视频。以假乱真的声音,再加上贴合《囧的呼唤》的视频内容,可能敖厂长本人看这个视频都会感到错乱。
TapTap
来源:B站UP主@Reecho睿声
梦回十年前
当越来越成熟的AI技术被运用到不恰当的地方时,也会给人带来很大的困扰。
就在上个月,一位乌克兰女生Olga Loiek发现了自己在中国被大量“克隆”。一些互联网账号用AI换脸的方式用Olga的形象进行带货,甚至实施诈骗。着给Olga带来了很大困扰,而她本人目前也正在维权中。
TapTap
所以我想,在AI技术越来越“以假乱真”的同时,我们的防范能力也需要进一步加强了。