本篇文章2840字,读完约7分钟

文/陈根

新型冠状病毒大爆发让我们实践了有史以来最大规模的远程办公室和在线学习。 我们采用的zoom和订书机等远程办公室工具具有前所未有的诉求。 微软teams在短短一周内新增了1200万客户,从3200万增加到4400万。 zoom再花了两个多月,采用户量就增加了20倍,达到了2亿人。

可以说疫情改变了全球的商业方式,改变了学生群体的学习、答辩、毕业方式。 据说在疫情蔓延的地区,一些高中毕业生将当场毕业。

家里很无聊,很多人都改变了ai的脸,用别人的脸代替自己的脸,从而增加了喜悦。 远程办公、在线学习的局限,让每个人思考五花八门的“抓鱼”方法,想用ai克隆另一个自己,代替自己的办公室和学习。

那么,改变ai的脸后克隆ai,是ai的另一大进步,还是新潘多拉魔盒的开放? 将来我们开视频会议的时候,可能真的会出现参加的都是ai头像的场景吗?

改变ai的面貌并不是什么新鲜事

ai变脸可以追溯到年末,海外论坛出现了id为“deepfakes”的顾客,该顾客发表了通过机器学习交换视频脸部的ai算法。 但是,当时该技术的采用门槛还很高,需要编译代码等操作。

一个月后,有人对公开的算法进行了改造,发售了简易版ai换脸工具“fakeapp”。 这次,普通用户也可以顺利操作。

虽然fakeapp改变了ai的面貌,大大降低了采用门槛,但还需要做一定的准备。 首先,需要安装其他运行时库;然后,需要对硬件提出诉讼,并需要高性能显卡参与计算。 其中,与n卡的兼容性最高。

fakeapp还需要允许安装新的windows 10系统。 执行需要时间。 过程越长越有效。 毕竟,机器学习需要足够的时间和样本。 最后,fakeapp几乎可以用假乱真的ai生成变脸视频。

改变ai的脸部有重要的项目。 那就是初级运动模型。

初级运动模型(动画模型)以自我学习的关键+局部仿射变化的组合建立了许多复杂的运动模型,目的是在大目标姿态发生动态变化的情况下,应对以前传递给模型的质量差的问题。 模型采用自我监控的方法将外观与体育新闻分离。 首先由两个主要模块组成:运动估计模块和图像生成模块。

运动估计模块的目的是预测密集的操场,这里假设存在抽象的参考坐标,估计存在“从参考到源”和“从参考到驱动”两个变换。 这是因为可以独立解决源框架和驱动器框架。 这是因为模型在测试时可能会接收到从不同视频中采样的一组源图像帧和驱动器帧,并且在视觉上可能会有所不同。

首先,研究者利用通过自我监控法学习的特征点得到稀疏轨迹集,并近似计算两个变换。 与仅使用特征点的位移相比,利用局部仿射变换来对各特征点附近的运动进行建模可以获得越来越多的变换。

第二,密集的运动互联网可以组合局部仿射,得到最终的密集操场。 除此之外,这个互联网可以输出口罩。 蒙版中显示“driving”的部分可以通过变换源图像来重建,该部分将被修复。

最终,它将生成模块渲染源对象的图像。 这里,采用的是基于密集的运动对源图像进行变形,从而修复源图像被遮挡的部分的生成器的互联网。

简单地说,一阶运动模型的特征是,经过描述同一类别的对象的一系列视频训练(例如,脸、人体),可以应用于这种对象。

从ai换脸到ai克隆

最近,一位叫马特·里德的工程师成功地基于一次运动模型开发出了代替自己参加zoom视频会议的ai。

虽然整个剧情并不复杂,但根据导言,他将在zoom开会的照片剪了一点,然后根据artyom.js开源库(拦截和响应)构建了一个简单的网络应用程序,并说:“你好, 、“明白了吗”、“再见”等。

理想情况下,zoombot无需任何人观察“hello”到“bye”的整个会议过程即可解决。 但是,现阶段的项目越来越多,是因为有趣才确立的,还不完全。

认为领先好的部分是不用给予“hey、siri”这样的觉醒语也可以采用。 如果外界有声音触发,它可以响应并随着脸部的运动做出响应。

构建zoombot项目总共花了约4个小时,而里德组织了zoom会议,花了约4个小时记录同事们的真实反应。 里德说:“诀窍是在演讲结束前离开会议室。 “我听不到你的声音,能重复一遍吗? ”。 在死亡循环中很麻烦。

潘多拉的盒子是否会打开

当然,里德在实际的视频会议中采用他的zoombot时,给视频会议越来越麻木的同事们带来了很多欢乐。

但是,喜悦背后的往往是更深的警戒。

ai必须改变面貌的风险问题是,首先对新闻的真实性提出严峻的挑战。 ps发明后,图已不再真实。随着ai视频换脸技术的出现,视频也开始变成镜花水月。 视频被认为是担负“实锤”的,但现在这个实锤可以随便制作。 对本来充满虚假信息的互联网来说,这无疑会导致更严重的信任崩溃。

其次,侵犯肖像权的可能性大幅提高,谁也不希望自己的脸出现在莫名其妙的视频中。 与多功能的ps等修图软件不同,ai的换脸技术只有一个功能,那就是换脸。 从这个角度来说,它的存在是天然的,是对肖像权的威胁。

换句话说,ai的换脸技术可能感兴趣,但真正的问题是,这种高风险的技术我们不能玩吗?

随着ai变脸的普遍出现,ai变声也开始崭露头角,谷歌以前研究过ai变声的相关技术,但没有大规模的安装。 但是,国内制造商更激进,许多研究输入方法的制造商试图在产品中宣传ai变声功能。

用一点输入法,现在就能找到ai变音的开关。 输入一段声音后,可以瞬间生成特定的音调和音色的声音,似然性相当好。 modulate.ai这个网站提供ai变音服务,甚至奥巴马的声音都可以完美模仿。

ai变声技术正在成熟,与ai换脸技术相结合将成为威力巨大的组合拳。 年3月,《华尔街日报》报道,一名罪犯利用ai技术模仿英国某能源企业德国母公司首席执行官的声音,成功诈骗220,000欧元(约1,730,806人民币)。 只要改变ai的声音就能制造出如此重大的诈骗案,ai诈骗的威力可见一斑。

而且,ai变声也不是ai技术的终点,领先的zoombot更像是一个比喻。 在未来,不仅仅是真实的ai换脸、ai变声,甚至连回应都有可能成为ai。 如果ai能够通过伪乱自动生成真实的面孔、声音和语言,互联网和整个社会该如何应对这种身份新闻的混乱?

今天,一点银行基于人工智能推出了人脸识别的网络支付转账系统,进行了大额转账。 这个技术看起来“完美”安全,但在ai变脸技术面前,这个技术可能会成为最脆弱的安全防御技术。

有一天,任何人发表或引用的任何资料,都可能被怀疑有故意或无意的修改。 更可怕的是,我们甚至不知道自己被骗了。 运气好的话,人们可能会注意到从遥远的日子里又打开了一个潘多拉魔盒。 科学技术正以我们难以预见的方式迅速发展和发展,这给目前的全球治理和法律监管体系带来了巨大的挑战。 信息推荐

在这一刻,为自己鼓掌!

□新华社当地时间4月23日,在英国雷丁,皇家伯克郡医院的医务人员在医院外鼓掌。 新型冠状病毒突然发生后,每周四晚上8点,英国...

标题:“从AI换脸到AI开会 潘多拉的魔盒会否打开”

地址:http://www.ok-sl.com/ozdt/8402.html