登榜抖音排名第一的网红 果然还是翻车了
今年可以说是,各种AI应用迸发的大元年了。
不管是ChatGPT,还是国内各种新生大模型,在日常问答、结合上下文理解等场景,都已做得相当成熟。
就连,集人类智慧语言大成的艺术——拍马屁。
你说好玩么,固然是好玩的。
但文字的表现力,也终归是不如图片和视频的。
不管是普通网友,还是在捣鼓AIGC的工程师,都渴望能用上更先进成熟的AI生图、扩图等功能。
此前呢,也确实有好几个AI扩图的应用,陆续面世。
比如PhotoShop的【创成式填充】,能直接扩展出海边全景图。
又比如,机哥之前给大伙详细盘过的,美图秀秀【AI扩图】功能。
它们都很好,但唯独使用门槛上,有亿点点高。
要么是要用到电脑,要么是免费次数有限。
用到一半收费,带来的痛苦不亚于,洗澡突然断水...
So,或许是意识到,网友们对于AI整活的强烈需求。
浓眉大眼的抖音,最近也搞起了【AI扩图】,还直接登上抖音热榜第一。
愿景十分美好:
“AI扩图,一秒拯救废片。”
但大伙都懂的。
那稍显稚嫩、练习时长还不足两年半的【AI扩图】。
即使再怎么稳健,也难免会有翻车的时候。
在抖音的【AI扩图】板块里。
总是能出现一些,令人始料未及的扩图元素。
比如,这个“一人一狗”躺在床上的场景,满满的温馨。
那经过【AI扩图】处理后,画风一定也很温暖吧?
只见画面中,多出一个年轻貌美的欧美女生。
看来AI还是懂人类最朴实的需求——渴望陪伴。
而男主也确实,在这场景下华丽转身,成为了霸道总裁。
弥补遗憾、成全人类,无疑是AI造福人类的一大体现。
但有一个问题,机哥不知当讲不当讲。
咱就是说,这哥们儿的手,咋就剩下半截了?
如果说残忍“截肢”,还能说是【AI扩图】对场景识别出错所致。
辣么,把人下半身补全为“人马”,阁下又该如何解释呢?
这可不是,AI把人类“动物化”的孤例啊。
还有一位网友,特意选了一张打脸局部图,来考验AI的扩图准确度。
至于AI扩图的结果嘛。
机哥劝大伙做好心理准备,看了多少有点恐怖谷效应的...
原本好端端的一位帅哥,被AI直接扩成狗子了。
说它瞎搞吧,它精准保留了左上角的灯源。
说它正经吧,又给人类硬生生切换了物种。
反正,这种对着大脸自拍的,就特别容易翻车。
人类可能不会在同一个地方跌倒两次。
但依靠海量素材训练的AI,显然是会的。
这么看下来。
抖音的【AI扩图】,对人物肢体部位的还原,还是很抠脚。
运气好的话,确实能还原出正常的四肢。
但要是AI玩得奔放点,它绝对能给你整出一些,令人眼前一黑的狠活...
各种离谱的翻车,让机哥更加好奇。
处理时间短一些的【AI扩图】,效果就如此不堪么?
正所谓实践见真章。
我还是没忍住下了个剪映,试试这【限免】的扩图,到底是怎么个事儿。
像这类,直接面向广大用户开放的AI功能,使用起来都很简单。
在App里随便导入一张图片,点击【抖音玩法】,就能找到扩图功能。
初来乍到,机哥还是先挑了一张,难度没那么高的风景图。
而这,是经过抖音AI扩图后的效果。
我是主观觉得,效果一般般。
首先是整张照片的色调,在经过AI优化后,暗沉了许多。
而且这明明是个电线杆,被AI扩充后,反而成了...椰子树?
如果是食物图,会不会出现些离谱要素捏?
你别说,扩充得还行。
桌上多了一盆花,右边的食物多出的部分,也毫无违和感。
如此看来,这AI处理一些风景和事物,还是游刃有余滴~
可问题的关键还是在于,它到底能不能人给扩充好。
毕竟钢筋水泥和绿树青山啥的,咱们天天都能拍上。
但好的人像照片,却常常稀缺。
老规矩,咱们难度循序渐进,先用国外很火的“老外回头”梗图试水。
扩图后的效果其实还行,AI显然是识别到了图片有街道。
于是就顺着原有场景,补全了行人和店铺。
甚至连背景的景深虚化,都考虑进去了。
但机哥还是想说,这【AI扩图】只能看个整体氛围感。
要是像列文虎克那般细看,那基本没有一种图,是能经得起考验的。
比如这张图里的牛仔裤,就莫名其妙被缝合了红色布料,脚的形状也很奇怪。
接着再来一个,很经典的“思考的黑人”图。
扩图后,整体看下来没啥违和感,翻车的地方也有,但比前面的效果都好上不少。
测到这里,机哥算是摸清了抖音这个【AI扩图】的特性。
画面元素越简单,扩图效果就越好。
毕竟生成式AI嘛,最擅长的就是“无中生有”了。
但如果画面要素太杂,AI就会追求“啥都要”,导致照片出现与现实场景不符合的东西...
比方说,这张图里面的轮椅...
还有一个要点,千万不要只留半边脸给AI。
机哥亲测,半脸图基本试一次,翻车一次。
机友们也不想,自己的肤色被切换,脸部表情被扭曲吧?
不过话说回来。
AI扩图翻车的例子虽多,但不意味着,AI做不好这事儿。
机哥体验过很多“生成式AI”。
包括纯文本的、文生图的、图片扩展的和图片转视频的...
可以说,“生成式AI”都有一个很明显的特点:
你给它计算的时间越多,它反馈给你的成品,质量就越好。
但市面上的【AI扩图】功能,基本都面向大众用户的,对出图的速度追求,优于质量追求。
毕竟要是大伙等得太久,谁还乐意用啊。
而追求快呢,就难免会出现翻车,二者不可兼得。
但我觉得,现阶段的痛点,很快就要被更新的技术给解决掉。
更别说,现在的生成式AI,已经进入了——
动动鼠标,就能让静态图动起来的全新阶段。