曾经制作诡异视频的AI，居然这么快就"以假乱真"了？

2024/2/228 浏览综合

“知道AI进化的速度快，但没想到它能进化得这么快。”

一年前，一段 “威尔史密斯吃面”的视频在互联网上疯传。

那时候大家都把这回事儿当做乐子来谈，因为AI生成的视频实在是过于诡异和无厘头，很难和现实联系在一起，更别提运用到实际生活上了。

TapTap

但AI进步的速度似乎超出我们的想象——

一年后，AI带着能够以假乱真的视频，再一次刷新了我们的认知上限。

TapTap

你没看错，真是AI生成的

相信这两天，大伙们都已经刷到过不少类似上面的AI视频了。

就在2月16号，OpenAI旗下一个名为“Sora”的AI生成视频模型开启了内测。和“文生图”的方式一样，只要你输入一段介绍，Sora就能给你生成一段时长60秒的视频。

“Sora”在日语中意为“天空”

其实早在Sora推出之前，就有不少厂商在研究AI视频模型了。像是meta推出的“make a video”，stable diffusion他们家的stable video，最近还有谷歌的推出Lumiere。

TapTap

谷歌Lumiere生成的视频

虽说各家的AI视频在打磨下也都变得越来越成熟吧，但Sora的出现，还是给这些AI视频模型来了次实打实的“降维打击”。

你看，这些视频中关于人物精度和场景设计的表现，如果不说是AI制作的，我还真以为是某个电影的片段；

TapTap

TapTap

在这几个视频中，物体运动轨迹和碰撞效果的逼真程度，都真实到让我不敢相信自己的眼睛。

TapTap

TapTap

最绝的是Sora生成的风景视频，从画面上看几乎没有一处不合理的地方，让人以为是现实中航拍画面。

TapTap

甚至Sora还能够生成游戏的实时画面，在玩家主视角运动的同时，还能够同步生成游戏世界的动态变化，真的太神奇了。

TapTap

虽然这只猪看着有点怪

当然，逼真归逼真，如果你仔细看，其实还是能够通过各种细节“鉴AI”的，例如背景版上如乱码一般的字符，以及视频中突然出现的不符合逻辑的画面。看来至少到现在为止，我们还能勉强分清现实和虚拟的区别。

TapTap

TapTap

就在Sora生成的视频刷爆网络的时候，互联网上突然出现了一段关于“史密斯吃面”的对比视频。在一年前的对比下，一年后AI生成的视频已经有了质的飞跃。

TapTap

不过实际的情况有点乐——其实下面这个视频并不是由AI制作的，而是威尔史密斯本人亲自拍摄的吃面过程。

自己给自己整了个活

虽说是个乐子吧，但仔细想想还真觉得有些毛骨悚然，因为：

我们现在好像真的很难分清现实和虚拟的界限了。

推特的评论

这种模糊的边界感，首先就体现在了互联网上。

不知道是从谁开始的，自从Sora公布之后，推特上兴起了一场“以真乱假”的整活狂欢。

网友们会在推文中来上一句“这个视频是由Sora生成的” （This video was generated by Sora），在加上模仿AI生成视频所用到的提示词。

这些视频通常是一些现实生活中比较荒谬的行为，而这种无厘头刚好可以和满足任何需求的AI挂上钩。

TapTap

“在酒吧顶着啤酒跳舞”

当然还有些电影的情节。不得不说，有的奇葩电影剧情真的天马行空，离谱到连AI都自愧不如。

TapTap

如果不是看过这个电影解说，我就真信了

甚至还有的抽象视频，再配上更为抽象的文字，还真有种 “AI生成的美感”。

TapTap

整活归整活，随着“假装AI”的狂欢越闹越大，也有不少网友产生了一些担忧——当Sora公测之后，这些AI视频大量投入到互联网，以后我们该怎么分辨真假呢？

我想了想，好像还真的挺难的。

且不提如今真实性极强的Sora，就连之前出现的AI技术也变得越来越“以假乱真”了。

还记得去年4月份，互联网上就有诈骗份子利用AI换脸、AI声音技术骗到人的消息。而随着时间的推移，这些只会被打磨的越来越成熟，难以被人分辨。

例如上周我就在B站上刷到了一位UP用AI声音“复活”敖厂长的视频。以假乱真的声音，再加上贴合《囧的呼唤》的视频内容，可能敖厂长本人看这个视频都会感到错乱。

来源：B站UP主@Reecho睿声

梦回十年前

当越来越成熟的AI技术被运用到不恰当的地方时，也会给人带来很大的困扰。

就在上个月，一位乌克兰女生Olga Loiek发现了自己在中国被大量“克隆”。一些互联网账号用AI换脸的方式用Olga的形象进行带货，甚至实施诈骗。着给Olga带来了很大困扰，而她本人目前也正在维权中。

所以我想，在AI技术越来越“以假乱真”的同时，我们的防范能力也需要进一步加强了。