自(zì)聊(liáo)天机(jī)器人ChatGPT火(huǒ)爆以来,微(wēi)软公司创始(shǐ)人比尔(ěr)·盖茨已(yǐ)多次公(gōng)开谈论人(rén)工智能(néng)话题。在最(zuì)近的一次(cì)采访中,他再(zài)次表示:“AI可能会让科技行(xíng)业(yè)迎(yíng)来(lái)一(yī)次(cì)剧(jù)烈的洗牌”。
这个结论是他(tā)在(zài)当地时间2月(yuè)20日接受《In Good Company》节(jié)目专访时提出(chū)的。
他预期,AI的发展可能会(huì)威胁到谷歌(gē)的市占(zhàn)率,因为(wèi)微软在(zài)AI方(fāng)面的行(xíng)动相当(dāng)迅速。而最终科技巨头将(jiāng)把(bǎ)AI整合成用户(hù)的(de)“全能助手”,包揽一切应用,与(yǔ)人们进行沟通(tōng)并(bìng)提(tí)供建(jiàn)议,可以取代亚马逊(xùn)、Siri或Outlook等应用。
大佬(lǎo)口(kǒu)中全能助手的到(dào)来可能尚需(xū)时日,但由ControlNet引发的(de)又一次AI绘画浪潮,让(ràng)AIGC在(zài)ChatGPT的话题热点包(bāo)围中杀出重围。
01
ControlNet颠覆(fù)AI绘画(huà)新(xīn)玩法
AIGC向可控靠近
以AI绘(huì)画(huà)为代表的(de)AIGC上一次爆(bào)火的时候,还是2022年(nián)8月,在美国科罗拉多州(zhōu)举办(bàn)的(de)新兴数字艺(yì)术家竞赛中,一(yī)幅名为《太空(kōng)歌(gē)剧院(yuàn)》的作品(pǐn)获奖。
随后各大厂商的AI绘画软件(jiàn)被广大网(wǎng)友熟知并体(tǐ)验,Stable Diffusion便是其中代表。
用户们可以在(zài)应用中输入一(yī)组关键词或者一张照(zhào)片(piàn),就能获得一幅AI创作(zuò)的画作(zuò)。
作(zuò)画的关键就是所输(shū)入的文本(běn)。同一组关键(jiàn)词也可以创作出很多张风格不一样(yàng)的画(huà)作,这让创作的(de)过程(chéng)就像(xiàng)开(kāi)盲盒(hé)。
很多用户很喜欢(huān)这种不确(què)定的惊喜,他们(men)会将生成(chéng)的美图当做(zuò)头像。而(ér)另一部分喜欢翻看(kàn)AI绘画的“翻车”作品。在社交媒体上,许多用户分(fēn)享(xiǎng)AI“翻(fān)车现场”,例如(rú),一位网友(yǒu)的小狗(gǒu)照片被(bèi)AI画成了(le)“肌肉男(nán)”,还有网友的个人照(zhào)片被AI识别(bié)成了建筑(zhù)。
而如今(jīn)随着(zhe)ControlNet的(de)出现与加持,以往AI绘画的填写关键词游戏可能要被(bèi)颠覆了(le)。
ControlNet是一位正在(zài)斯坦福读博的中国人张吕敏(mǐn)创作的一种(zhǒng)基于控(kòng)制点的图(tú)像变形算(suàn)法,主要(yào)用于数字(zì)图像处理、计算机视觉(jué)和计算机(jī)图形(xíng)学(xué)等领域。
其SD插件一经发布,在短(duǎn)短的两天(tiān)内便(biàn)成为了AI绘画领域最新的热(rè)点。
在此之前,大家用(yòng)了很(hěn)多(duō)方法(fǎ)想让AI生成(chéng)的结果尽可能的(de)符(fú)合要求(qiú),但是都不尽如(rú)人(rén)意(yì),它的(de)出现代表着AI生(shēng)成开(kāi)始进入真正的(de)可控时(shí)期。
因为ControlNet可(kě)以直接提取(qǔ)画面(miàn)的构图,人物的姿(zī)势和(hé)画面(miàn)的(de)深度信息(xī)等。有了它的帮(bāng)助,就(jiù)不用频(pín)繁(fán)的用提(tí)示词来碰(pèng)运气(qì),抽盲盒式的创作(zuò)了。
通俗的说ControlNet相当于给AI绘画加(jiā)了(le)“魔法”,不少博主(zhǔ)的作品已经获得了(le)大量的浏览量,“viggo”就是其中之一,他用朋友(yǒu)的照(zhào)片直(zhí)接带她们(men)走进动漫世(shì)界。
viggo先用StableDiffusion图片(piàn)转(zhuǎn)文字。
再用Text2Prompt插件拓展找(zhǎo)到对应的(de)关键(jiàn)词;最后(hòu)用ControlNet插件绑定骨(gǔ)骼开始换关键词试效果。
通过(guò)图片就(jiù)可以看出(chū)来,效果(guǒ)十分惊艳。
更厉(lì)害的(de)是,除了(le)真(zhēn)实的照片,草图也(yě)可以加上“魔(mó)法”,知乎(hū)大牛“DevPoint”和(hé)“逗(dòu)砂”介绍到ControlNet还能实现线稿转全彩图。大神张吕敏其本尊也亲自回应。
不(bù)得不说当(dāng)下AIGC已经变得越来越强大,甚至输出的作品都已经能(néng)以假乱真了(le)。
02
难辨(biàn)虚实,AIGC技术(shù)力爆(bào)发
警惕安全问(wèn)题
近(jìn)日,“苏州金鸡湖有(yǒu)游艇party”的消息火(huǒ)遍网络,而经(jīng)过警方(fāng)辟谣这所谓的“party”可能是全国第(dì)一起AI绘图诈骗。
由于这个活动里面给出的美女(nǚ)照(zhào)片都是AI制作的(de)真人照片绘图,因为(wèi)太逼(bī)真,被大家(jiā)当成真事传(chuán)播了。
不过仔细观察可以(yǐ)发现,活动(dòng)发(fā)起者提(tí)供的照片中有个很大的漏洞可(kě)以发现(xiàn)并非真人,而是AI绘(huì)图,那(nà)便是图片中女性的手指部分有的(de)存在(zài)异常。
有行业人事表示(shì):“现在因为(wèi)手指部分的(de)绘画算法比较(jiào)复杂,AI还不太(tài)会(huì)画人(rén)的手,但最新看(kàn)到的图片已经有越来越完美的(de)AI模型出(chū)现,以后可能就完全没有(yǒu)漏(lòu)洞了(le)。”
类(lèi)似(shì)的AI作图诈骗在国外也已(yǐ)有发生。据英(yīng)国广(guǎng)播公司报道,土耳其地(dì)震期间,有Tiktok用户使用AI合成(chéng)了儿童受(shòu)灾的假照(zhào)片发(fā)布(bù)到网(wǎng)络,以此诱骗善良(liáng)的人(rén)打赏“捐助”从而实施诈骗。
目前(qián)随着技术发(fā)展,AIGC已经(jīng)能做出真(zhēn)人照(zhào)片般的(de)绘图效(xiào)果,如(rú)果(guǒ)这样的(de)图片被用(yòng)来诈骗,将(jiāng)非常可(kě)怕。
此外(wài)AIGC还引发了很多担(dān)忧,一方面,批判(pàn)者认(rèn)为AI在(zài)“学习”了(le)大量前人(rén)的作品(pǐn)之(zhī)后,其创作没有任何情绪和(hé)灵魂,难(nán)以和人类的艺术创作相(xiāng)提(tí)并论。
另一方面,AIGC背后的版权、目前都并(bìng)没(méi)有(yǒu)得到有效的解决,还有AIGC会不会代替人类“至高无(wú)上”的创意。
马斯克也强调,人(rén)工智(zhì)能(néng)的(de)安(ān)全问题需要得到重视,太晚(wǎn)就来(lái)不(bù)及了。
03
AIGC下一站除了视频,还(hái)有远(yuǎn)方
技术都(dōu)是(shì)有两面性的(de),潜(qián)在的(de)危害(hài)并不能掩盖其光辉的(de)贡献。现(xiàn)在看来,人工智能技(jì)术将是(shì)第四次(cì)工业革(gé)命(mìng)的核心(xīn)驱动力量,将创造新的增(zēng)长奇(qí)迹。
过去(qù)一年,人工智(zhì)能在技术和商业(yè)层面都有了巨大(dà)进展,AI绘(huì)画就是人工智(zhì)能技术发(fā)生方向性改(gǎi)变的一个代表。其(qí)下一站或许就是(shì)视频。
此前,Meta和谷歌先后发(fā)布了几条引爆科技圈的(de)短(duǎn)视频。这些(xiē)视频(pín)引发关注并非内容做得多优(yōu)秀,反而都非常简(jiǎn)单,比如一匹正在喝水的马(mǎ),一只画画的玩具熊,或者一(yī)段骑摩托车的(de)第一(yī)视角录(lù)像(xiàng),随便一(yī)个有(yǒu)手机的(de)人(rén)都可(kě)以随手录下一段。
但这(zhè)些短视频的创作方式非常简单,创作者仅仅(jǐn)需要(yào)向AI输入一(yī)段话,甚(shèn)至只(zhǐ)是说一下(xià)要求,AI就可以(yǐ)根据需要生成(chéng)一段视频(pín)。
谷歌发布(bù)的(de)两个(gè)AI生成视频分别来自(zì)于Imagen Video和Phenaki,前者主要突出的是高(gāo)清,与Meta的Make-A-Video没有太多(duō)的差别。
在Make-A-Video公布了(le)AI生成的视频后,AI圈就已经玩了一(yī)波(bō)梗,一个能够做出更高清视频的AI还不足以(yǐ)在短时间内戳中兴奋点。
Phenaki更加令人震惊的地方在于,它可以制作出(chū)超过2分钟的连贯的也有确切内(nèi)容的视频,这才是(shì)真正让人们感到惊喜的(de)地方。因为(wèi)无论(lùn)AI生(shēng)成的视频多么高清,也(yě)只能是为内容生产者提供一个灵(líng)感,一(yī)个素材,一(yī)个(gè)过场动画。
不过能够(gòu)制作出有具体剧情内容的视频(pín)就意味(wèi)着,一些视频(pín)创(chuàng)作由AI代替人工完成已经(jīng)初步(bù)有(yǒu)了可能。
当下AI的发展(zhǎn)速(sù)度已经超(chāo)过大部分人的想象。内容产业的(de)本质是供给创造(zào)需(xū)求,AIGC作(zuò)为(wèi)全新的内容生产方式(shì),可以为内容产业带来更新的内(nèi)容风格(gé)、更(gèng)快的生产速度,更低的生产成本,这无(wú)疑会驱动(dòng)内容(róng)产业的大(dà)爆发。
除了(le)AI绘图、视频(pín),AIGC技术还能应(yīng)用于(yú)音乐、代码、机器人动作等多种内容形式(shì)的生(shēng)成。不难发现该项技术(shù)不仅(jǐn)在游戏等(děng)行业能得到有效应用,对于(yú)下(xià)一代(dài)互联网(wǎng)各种元素(sù)的构建亦(yì)有关键意义。
从商(shāng)业化的角度(dù)来看,文化娱乐、教(jiào)育、传媒等诸多(duō)领域,本身就对基于AI的(de)可(kě)视化(huà)内容(róng)有强烈需求。
因此(cǐ),AI绘(huì)画(huà)及(jí)视频(pín)或不是(shì)结果,而只(zhǐ)是AI进程中(zhōng)的一(yī)块重要拼图,有望在技术更新的加持下实现(xiàn)更大的应用价(jià)值。
AI从理解内容,走向(xiàng)了可以生成内容,甚(shèn)至(zhì)能(néng)够创造出独立价(jià)值和独立视角的内容(róng)。AIGC的再次出圈,更代表着未来的先进(jìn)生产力即将到(dào)来。
04
紧抓(zhuā)大模(mó)型与(yǔ)算力,牢固AIGC底座(zuò)
从技术(shù)的发展也可以(yǐ)看(kàn)出,在语(yǔ)言大模型、图像大模型之(zhī)后,多(duō)模态大模(mó)型已经成为了新的趋势。
大(dà)模型被誉为(wèi)当前人工智能(néng)发展的智(zhì)能(néng)底座,是全球(qiú)竞争最激烈的研(yán)究方向(xiàng)之一,包括谷(gǔ)歌、亚(yà)马逊、百度、阿里、腾讯等众多头部(bù)企业(yè)都在竞相发力。
不过训练(liàn)大模(mó)型的确价格不菲,以国盛证券(quàn)发布的《ChatGPT需要多(duō)少(shǎo)算(suàn)力》报(bào)告(gào)估(gū)算,GPT-3训练(liàn)一次的(de)成本约为140万美(měi)元。而(ér)对(duì)于一些更大的LLM(大型语言模型),训练成本(běn)则介于200万美元至(zhì)1200万美元高价(jià)之间(jiān)。
以ChatGPT在(zài)2023年(nián)1月的独立访客平(píng)均数1300万计算(suàn),其(qí)对应芯(xīn)片需求为3万多片英伟达A100 GPU,初始(shǐ)投(tóu)入(rù)成本约为8亿(yì)美元(yuán),每日仅电(diàn)费就在(zài)5万(wàn)美元左右(yòu)。
此外不论是(shì)ChatGP碾压与辗轧的区别是什么,辗轧与碾压有什么区别T还是AIGC,都离不开庞(páng)大算力支持。在关注各类大(dà)模型(xíng)的发展同时,更应该(gāi)关注算力网(wǎng)络的建设。
算力网络正(zhèng)驱动AI产业发(fā)展进入史诗级加速进程,让AIGC及通(tōng)用(yòng)AI这一人工(gōng)智能发(fā)展(zhǎn)的(de)终极目标离得更(gèng)近(jìn)。
因为算力可以对突(tū)破性(xìng)技术创新提供大(dà)力的支(zhī)持(chí)。这(zhè)方面,多模态大模型是典型。作为(wèi)面向(xiàng)未(wèi)来强人工智能(néng)、通用人工智能的(de)重(zhòng)要(yào)技术创新,多模态大模型已(yǐ)经在人工智能领域提(tí)出了很多年(nián),业(yè)界(jiè)也有不少技(jì)术(shù)突破,但是,多模态大(dà)模(mó)型(xíng)进一步往下走,算力需求(qiú)呈几(jǐ)何式上(shàng)升,一般(bān)的算(suàn)力基(jī)础设施(shī)很快将难以胜任。
从图(tú)像、文字、语音单(dān)独一项(xiàng)的训练,到(dào)双模态、三模态的跃迁(qiān),让人工智能可以灵活应对不同模态的转化、像人(rén)与世界交(jiāo)互一样自然(rán),这(zhè)方面,由算力(lì)网络来驱动将(jiāng)有明显优势。
此外,还有很多需要爆发式(shì)增长的算力来支撑的(de)技术(shù)创新,将(jiāng)在人工(gōng)智能算力(lì)网络支撑下快速推进。
AIGC已经(jīng)露出曙(shǔ)光,期(qī)待在(zài)大模型和大(dà)算力的支(zhī)持(chí)下AIGC能持续颠覆内容生产的方式,将(jiāng)创造的边际成本降低,让万(wàn)众受益。
未经允许不得转载:连云港装饰公司,豪泽装饰 碾压与辗轧的区别是什么,辗轧与碾压有什么区别
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了