日本那种片的马赛克,终于可以完美的去除了

好机友 2020-07-04 12:50+-

还记得很久之前,机哥给大家介绍过的GAN吗?不是脏话啦,是Generative Adversarial Networks的缩写,即“生成式对抗网络”。





这是一种深度学习的模型,如果大家记不清了,机哥通俗解释一下:

在一个GAN里,有两个天天对着干的神经网络,一个努力生成逼真的假货,一个努力鉴别假货,通过不断地学习和对抗,它们就能生成极其真实的假货,非常妙。

总之,GAN的出现那叫一个惊为天人。

因为它可以无中生有,创造出世界上不存在,但又极为真实的人脸。



没错,上面这些脸,全都是GAN生成的

后来,GAN被运用到图像增强领域,进而名声大噪。



因为……它能实现一项,我们以前不敢奢求的功能——去马赛克。。



就拿2018年大火的软件DeepCreamPy来说吧。

它就是利用GAN来实现去码的,效果大概是这样:



这张图片,用绿色画笔涂上了码。





拿DeepCreamPy操作一番后,马赛克神奇般地消失了。





横向对比一下,效果的确不错。



但肯定会有机友要说:就这?



确实,这张卡通图片,去码难度并不算高,能实现这样的效果也不算啥。

别急,时代在发展,技术在进步。



上个月,美国杜克大学推出了一款图像增强工具,又一次勾起了机哥燥热的心。

这款工具叫PULSE。



不扯虚的,PULSE能实打实地把重码图,处理成高清大图。



不看广告看疗效,机哥直接放实例:



这图的分辨率够渣了吧,机哥甚至可以直接数出它的分辨率为16x16。

经过PULSE一处理,它会变成什么样呢?



请做好心理准备。

……………………

…………

当当当当!



简直不敢相信自己的眼睛。。

我们放大头发部分看看细节。



明明只有几个像素格,它硬是还原成了丝缕分明的秀发。



还有几组实例:

左为原图,右为处理后





看了这些去码作品,机哥还是难以相信……



这tm真的不是魔法吗?

我知道,诸位老司机已经开始酝酿自己大胆的想法了。



但请你们压制一下,机哥本着认真负责的态度,还是得给大家讲讲原理。

很久以前,我们要提高一张图片的分辨率,往往是利用插值法,在低分辨率的图片中填充像素。

就比如PS的改变图像大小



后来有了GAN,虽然也是填充像素,但凭借机器学习,填充的方法变得更高级,更像是AI在凭经验“猜”。



但总的来说,以上方法去码效果有限。

而杜克大学的PULSE思路就很巧妙了,它选择反其道而行。

你给它一张低分辨率图,比如这张:



AI并不急着去填充,而是把自己以前GAN出来的高清图,压缩成低分辨率和你给的图片对比。





遍历之后,找出相似度最高的,把对应的高清图输出。





如果不理解的话,机哥再打一个通俗的比方。

物理考试中,有一道填空题,让我补全一个公式:



你如果让我去推导,E和c的关系,估计我这辈子都填不出正确答案。

但是换种思路,机哥在脑海中回忆背过的公式,其中含有E和c,且跟它长得像的……



不就是爱因斯坦质能方程嘛!



明白了吧,“直接推导”就像是去码算法中的老方法。

而“从回忆中找相似”,就类似于杜克大学的PULSE。



看到这玩意,机哥脑海里浮现了很多大胆的想法。

比如画家,再也不用细心去勾勒图片的细节,简单画几笔,再交给AI就好。



电影艺术也可以用上啊。

哪里还需要花钱请演员,费劲地布景、演、拍……



直接做个粗糙的脚本,剩下交给AI。



姜文的分镜头脚本就适合这么搞……



还有!

警察办案的时候,案发现场的摄像头,只拍到了全损画质的嫌疑犯。

机哥拿自己的照片举个例子

这哪儿看得出是谁啊?

没事,PULSE一下!



注:此图并非PULSE实际效果

噢,原来机哥长这样。



美滋滋吧……



慢着,事实上并没有你想象的这么美好。

吊炸天的PULSE刚公布没多久,就被网友们发现了问题。

有网友拿出奥巴马的照片,手动压缩了一番。



然后,他们把它放进PULSE里。



输出的结果,让人始料未及——



出来的这个面孔,虽然是张很真实的脸,但跟奥巴马大相径庭。

更坑爹的是,奥巴马本来是个黑人,却被AI硬生生还原成了白人。。

紧接着,又有网友发现不仅是黑人,用亚洲面孔去测试,输出的结果也会变成白人。

左为原图,中为压缩图,右为AI补全的图

知名华裔女星刘玉玲



本来种族歧视这事儿,在美国那儿就敏感,AI这一搞果然引起轩然大波。



很多人出来批评,认为AI存在偏见,一时之间骂声四起。

其实,PULSE会出现这样的结果,原因不难猜测。

PULSE基于英伟达的StyleGAN,而StyleGAN所使用的FlickFaceHQ数据集当中大部分都是白人面孔。





它就像一个从小只见过白人的小朋友,当然会以为全世界的人都是白人。

机哥觉得这与其说是偏见,倒不如讲是认知局限。

随着算法的精进,数据集日渐丰富,AI的认知局限肯定会越来越少。



除此之外,PULSE犯的错误还不止搞错人种,沙雕网友们还拿卡通形象试了试。

比如游戏《Wolfenstein》中的卡通像素脸。

左为输入图,右为PULSE处理后的结果

PULSE并没有把它变成卡通高清大图,而是用补真实人脸的方式,输出了一张不伦不类的奇怪脸。

minecraft当中的像素角色,有同样的遭遇。

左为输入图,右为PULSE处理后的结果





家喻户晓的马里奥,看来只有AI认不出来。

左为输入图,右为PULSE处理后的结果



甚至有人试了试emoji,出来个什么玩意儿。。

左为输入图,右为PULSE处理后的结果



也就是说,现阶段的AI补脸,虽然看起来像模像样。



但本质上还是瞎杰宝补的,它根本无法还原图片原本的细节。

所以,上面举警察办案的例子,如果真的采用PULSE处理的照片来确定嫌犯,八成会抓错人。



AI还需要更聪明,才能应对这个复杂的人类世界里,千奇百怪的问题啊。



但是,机哥要说但是了。

我知道在座的司机们肯定有话要说。

也许在你们大胆的想法里……有些东西补得是否还原本来的样子,可能并不重要吧。

  • 最新评论
  • g2j2

    假的,作为应用软件,做假和创作可以,用来还原就错得厉害。

    屏蔽
  • hardlyconfused

    把32x32的图打成16x16 的图,损失的信息是不可能找回来的 要补只能靠猜,这是基本的逻辑 标题党

    屏蔽
  • hcrab

    再补也是假的

    屏蔽
  • 杨晓

    我只是一个机械工程师,没钻研过图像处理。 有一个疑问,对那个16X16像素的打码图,是不是有隐藏的细节在图像文件内?如果没有,那就是重画的一张图,最多有人像大数据支撑画成一张人头而不是狗头。 如那张画马图,提供前四步给不同的画家,背靠背画出的马绝对是不一样的。

    屏蔽
  • 天总是蓝

    可以玩,不可以当真,原图丢失的信息是找不回来的,复制图片的信息是插补出来的,不同算法不同插补,可以是无穷尽的输出。属于骗钱找课题做的那种,还不如下乡挑大粪给社会做贡献的多。

    屏蔽
5