绿茶通用站群绿茶通用站群

艾特是什么意思

艾特是什么意思 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天机(jī)器(qì)人ChatGPT火爆(bào)以来,微软公司创始人(rén)比(bǐ)尔·盖(gài)茨已多次公开谈(tán)论(lùn)人(rén)工智能话题(tí)。在最(zuì)近的一次采访中,他再次表(biǎo)示(shì):“AI可能会让科技(jì)行业迎来一(yī)次(cì)剧(jù)烈的洗牌”。

这个结(jié)论是他在当地时间2月20日接受《In Good Company》节目专(zhuān)访(fǎng)时提出(chū)的。

他预(yù)期,AI的发展可能会威胁(xié)到谷歌(gē)的市占率,因为(wèi)微软在AI方面的(de)行动相当迅速。而最终科(kē)技巨头将把AI整合成用户的(de)“全能助手”,包揽一(yī)切应用,与人们进行沟通(tōng)并提供建(jiàn)议(yì),可以取代亚马逊、Siri或Outlook等应用。

大佬口中全能助手的到来可能尚需(xū)时日,但由(yóu)ControlNet引(yǐn)发的又一次(cì)AI绘画浪潮,让AIGC在ChatGPT的(de)话题热(rè)点包围中杀出(chū)重围。

ChatGPT之(zhī)后又一(yī)应用(yòng)杀(shā)疯了,AIGC或进入可控期,将洗(xǐ)牌(pái)科技行业?_黑料(liào)正能量

01

ControlNet颠覆AI绘画新玩法

AIGC向可(kě)控靠(kào)近

以AI绘画(huà)为代表(biǎo)的AIGC上一次爆火(huǒ)的时候,还是2022年8月,在美国科罗拉多州举(jǔ)办的新兴数字(zì)艺(yì)术家(jiā)竞(jìng)赛中(zhōng),一幅名为(wèi)《太空歌剧院》的作品获(huò)奖。

随(suí)后各大厂商的AI绘画软(ruǎn)件被广(guǎng)大网友熟知并(bìng)体(tǐ)验,Stable Diffusion便是其中代表(biǎo)。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可控期,将(jiāng)洗牌(pái)科技(jì)行(xíng)业?_黑料正能(néng)量

用(yòng)户们可以在应(yīng)用中输入一组(zǔ)关键词或者一张照片,就能获得一幅(fú)AI创作的画作(zuò)。

作画(huà)的关键就是所输入的文(wén)本。同(tóng)一组关键词也(yě)可以创作出很(hěn)多张风格不一样的(de)画作,这让创作的过程就(jiù)像开盲盒(hé)。

很多用户(hù)很喜欢这种不确定(dìng)的惊喜,他们会将生成的美图当(dāng)做头像。而另一部分喜欢翻看(kàn)AI绘画的“翻(fān)车”作品。在社(shè)交媒体上(shàng),许多用户分享AI“翻车现场”,例如,一位网友的小狗(gǒu)照(zhào)片被AI画成(chéng)了“肌肉男”,还(hái)有网友的个(gè)人(rén)照片被AI识别(bié)成了(le)建筑。

而如(rú)今(jīn)随着ControlNet的出现(xiàn)与加持,以往AI绘(huì)画的填(tián)写关键词游戏可能要被颠(diān)覆了。

ChatGPT之后又一(yī)应(yīng)用杀疯了,AIGC或进入可控期,将洗牌(pái)科(kē)技行(xíng)业?_黑料正能量(liàng)

ControlNet是一位(wèi)正在斯(sī)坦福(fú)读博的中(zhōng)国人张吕敏创作的一种基于控(kòng)制点的图像变形算法,主要用于数字图像(xiàng)处理、计算机(jī)视觉(jué)和计算机图(tú)形学等领域。

其(qí)SD插(chā)件一经发布,在短短的两天内便成为(wèi)了AI绘(huì)画领(lǐng)域最新的热点(diǎn)。

在此之前,大家(jiā)用了(le)很多方法想让AI生成的结果(guǒ)尽可能(néng)的符合要求(qiú),但是都不(bù)尽(jǐn)如人意(yì),它的(de)出现(xiàn)代表着AI生成(chéng)开始进(jìn)入真正的(de)可(kě)控时期。

因(yīn)为ControlNet可以(yǐ)直接提取画面(miàn)的(de)构图,人(rén)物的(de)姿势(shì)和画面的深(shēn)度信息等。有(yǒu)了它的帮(bāng)助(zhù),就不(bù)用频繁(fán)的用提示词来碰运(yùn)气,抽盲盒式(shì)的(de)创作了。

通俗的(de)说ControlNet相当于给AI绘画加了“魔法”,不少博(bó)主的作品已(yǐ)经(jīng)获得了大量的浏览量,“viggo”就是其(qí)中之一,他用(yòng)朋(péng)友(yǒu)的照片直接带她(tā)们走进动(dòng)漫世界。

ChatGPT之后又一(yī)应(yīng)用杀疯了,AIGC或进入可控期,将洗牌科技行业(yè)?_黑(hēi)料正能量

viggo先(xiān)用(yòng)StableDiffusion图片转文字(zì)。

再用Text2Prompt插件拓展找(zhǎo)到对(duì)应(yīng)的关键词;最后用ControlNet插件绑(bǎng)定骨骼开(kāi)始(shǐ)换关(guān)键(jiàn)词(cí)试效果。

ChatGPT之后(hòu)又一应(yīng)用(yòng)杀(shā)疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料正能量

通过图片(piàn)就可以看出(chū)来(lái),效果十分惊艳。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可(kě)控期,将洗牌科技(jì)行(xíng)业?_黑料正能量

ChatGPT之后又一应用杀疯了,AIGC或进入可控(kòng)期(qī),将洗牌(pái)科技行(xíng)业(yè)?_黑料正(zhèng)能量(liàng)

更厉害(hài)的(de)是(shì),除了真实(shí)的照片(piàn),草图(tú)也可以加上(shàng)“魔法”,知乎大(dà)牛(niú)“DevPoint”和(hé)“逗砂(shā)”介绍到ControlNet还能(néng)实(shí)现线稿转全(quán)彩图。大神张吕敏其本(běn)尊也亲自回应。

ChatGPT之后(hòu)又一(yī)应用杀(shā)疯了,AIGC或进入可控期(qī),将洗牌(pái)科(kē)技行业?_黑料正能量

不得不说当下AIGC已经(jīng)变得(dé)越来越强大,甚(shèn)至输出的作(zuò)品都已(yǐ)经能以假乱真了。

02

难(nán)辨虚实,AIGC技(jì)术力爆发

警惕安全(quán)问题

近日,“苏州金鸡(jī)湖有(yǒu)游艇(tǐng)party”的(de)消息火遍网络,而(ér)经过(guò)警方辟谣这所谓的(de)“party”可能是全国第一起(qǐ)AI绘(huì)图诈骗。

由于这个活(huó)动(dòng)里面给出的美女照片都是AI制作的(de)真人照(zhào)片绘图,因为(wèi)太逼(bī)真,被大家当(dāng)成真事传播(bō)了

ChatGPT之后又(yòu)一应用杀(shā)疯(fēng)了,AIGC或进入可(kě)控期,将(jiāng)洗牌科技行业?_黑(hēi)料正能量

不过仔细观察可以发现(xiàn),活(huó)动发起者提(tí)供的(de)照片中有个很(hěn)大的漏洞可以发现并非真人,而是AI绘图,那便是图片(piàn)中女性的手指部分有的存在异常。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入(rù)可控(kòng)期(qī),将洗牌科技行业?_黑料正(zhèng)能量

有行(xíng)业人事表示:“现在因为(wèi)手指部分的绘画算法比较复杂(zá),AI还不(bù)太会(huì)画人的手,但最新看到的图片已经有越来越完(wán)美的(de)AI模型出现(xiàn),以后可能就完(wán)全没有漏洞了(le)。

类似的AI作图(tú)诈骗在国外也已(yǐ)有发生(shēng)。据英国广播公司报道,土耳其地(dì)震期间,有Tiktok用户使用AI合成了儿童受灾的(de)假照片发布到网络,以此诱(yòu)骗善良的(de)人打赏“捐助”从(cóng)而实(shí)施(shī)诈骗。

目前随着技术发展,AIGC已经能做出真人(rén)照片般的绘图(tú)效果,如果这样(yàng)的(de)图片被(bèi)用来诈骗,将非常可(kě)怕。

此外AIGC还引(yǐn)发了很多担忧,一方面(miàn),批判者认为AI在“学(xué)习”了(le)大(dà)量前人的作品之后,其(qí)创作没有任何情绪和灵(líng)魂(hún),难以和人类的艺术创作(zuò)相提(tí)并(bìng)论。

另一方面,AIGC背后的版权、目前都并没(méi)有得(dé)到(dào)有效的解决(jué),还有AIGC会不会代(dài)替人类“至(zhì)高(gāo)无上”的创(chuàng)意。

马斯克也强调,人(rén)工智能的安(ān)全问题需(xū)要(yào)得到重视,太晚(wǎn)就(jiù)来不及了。

03

AIGC下一(yī)站除(chú)了(le)视频,还有远方

技术(shù)都是有两面性(xìng)的,潜在(zài)的危害并不(bù)能掩盖其光辉的贡献。现在(zài)看来,人工智(zhì)能技(jì)术将是第(dì)四次工(gōng)业革命的核心驱动(dòng)力量,将创(chuàng)造新的增(zēng)长奇迹。

过去一年,人工智能在技术和商业层面(miàn)都有(yǒu)了巨(jù)大进展,AI绘画(huà)就是人工智(zhì)能技(jì)术发(fā)生方向性改(gǎi)变的一个(gè)代表。其下(xià)一站(zhàn)或许就是视(shì)频(pín)。

此前(qián),Meta和谷歌先后发布(bù)了(le)几条(tiáo)引爆(bào)科(kē)技圈(quān)的短视频。这(zhè)些视频(pín)引发关注并非内容做(zuò)得(dé)多优秀,反而都非常简单,比如一匹正在喝水的马,一只画画的玩具熊(xióng),或(huò)者一(yī)段(duàn)骑摩托车的第一视角录像,随便一个有手机的人都可以随手录下一段。

ChatGPT之(zhī)后又一应用杀(shā)疯了,AIGC或(huò)进(jìn)入(rù)可控期,将洗牌科技(jì)行业?_黑料正能量

但(dàn)这些短视频的创作方式非常简单,创作者仅(jǐn)仅需(xū)要(yào)向AI输入一段话,甚至只是(shì)说一下要求,AI就可(kě)以根据(jù)需(xū)要生(shēng)成(chéng)一段(duàn)视(shì)频。

谷歌发布的两(liǎng)个AI生成视频(pín)分别来自于Imagen Video和Phenaki,前者主要突出的是高清,与Meta的Make-A-Video没有太(tài)多的差别。

在(zài)Make-A-Video公布了(le)AI生成的视(shì)频(pín)后,AI圈就已经(jīng)玩(wán)了一波梗(gěng),一(yī)个能够做出更高清(qīng)视频的AI还不足(zú)以在短时间内戳(chuō)中兴奋(fèn)点。

Phenaki更(gèng)加令人震(zhèn)惊的地方(fāng)在于,它(tā)可(kě)以制作出超过2分(fēn)钟的连贯的也有确切(qiè)内容的(de)视频,这才是真正让人们感(gǎn)到(dào)惊喜的地方。因为无论(lùn)AI生(shēng)成的视(shì)频多(duō)么高清,也(yě)只能是为内容生(shēng)产者提供(gōng)一个灵感,一个素材(cái),一(yī)个过场(chǎng)动画。

不过能够制作出(chū)有具体剧情(qíng)内(nèi)容的视频就意味着(zhe),一些视频创(chuàng)作由AI代替(tì)人工完成已经(jīng)初步有了可能(néng)。

当下AI的发展速度已(yǐ)经超过大部分人的想(xiǎng)象。内容产业(yè)的本(běn)质是供(gōng)给创造需求,AIGC作(zuò)为全新的内容生(shēng)产(chǎn)方(fāng)式,可以为内容(róng)产(chǎn)业带来(lái)更新的内容风(fēng)格、更快(kuài)的(de)生产速度,更低的生(shēng)产成(chéng)本,这无疑(yí)会(huì)驱动内容产业的大爆发。

除了(le)AI绘(huì)图(tú)、视频(pín),AIGC技(jì)术还(hái)能(néng)应用于音乐、代(dài)码、机器(qì)人动作等多种内容形式的生(shēng)成。不难(nán)发现该项技术不(bù)仅在游戏等(děng)行(xíng)业能得到有效(xiào)应(yīng)用,对于下一(yī)代(dài)互联网(wǎng)各种元(yuán)素的构建(jiàn)亦有关键(jiàn)意义。

从商业化的角度来看,文化(huà)娱(yú)乐、教(jiào)育、传媒等(děng)诸艾特是什么意思多领域,本(běn)身(shēn)就(jiù)对基于AI的(de)可视化(huà)内容有强(qiáng)烈需求。

因(yīn)此,AI绘画及视频或不是结果,而只是AI进程中的一块(kuài)重要拼图(tú),有望(wàng)在(zài)技术更新(xīn)的加持下实现更(gèng)大的(de)应用价值。

AI从理解内容(róng),走向了(le)可以生(shēng)成(chéng)内容,甚至能够创造出独(dú)立(lì)价(jià)值和独立视(shì)角的内容。AIGC的再次出圈,更(gèng)代表着未(wèi)来的先进(jìn)生产力即将(jiāng)到来。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量

04

紧抓(zhuā)大(dà)模型与(yǔ)算(suàn)力(lì),牢固(gù)AIGC底(dǐ)座(zuò)

从(cóng)技术的(de)发展也(yě)可(kě)以看出(chū),在语言(yán)大模型、图像大(dà)模(mó)型之后(hòu),多模态大模型已(yǐ)经成为(wèi)了新(xīn)的趋势(shì)。

大模型被(bèi)誉为当前人工智能发展的智(zhì)能底(dǐ)座,是全(quán)球竞争最激烈的研究(jiū)方(fāng)向之一,包括谷歌、亚马逊、百度、阿里、腾讯(xùn)等众(zhòng)多头部企业都(dōu)在竞(jìng)相发(fā)力(lì)。

不(bù)过(guò)训(xùn)练大模型的(de)确价(jià)格不菲,以(yǐ)国盛证券发布的《ChatGPT需要多(duō)少算力》报告(gào)估算(suàn),GPT-3训练一次的(de)成本约为140万美元。而(ér)对于一些更大的LLM(大型语(yǔ)言模(mó)型),训练成本则介于(yú)200万(wàn)美元至1200万美(měi)元高(gāo)价(jià)之间。

以ChatGPT在2023年1月的独(dú)立访客平(píng)均(jūn)数1300万计算,其对应芯片(piàn)需求为(wèi)3万多片英伟达A100 GPU,初始投入(rù)成本约为8亿美元,每日仅电费就(jiù)在5万美元左右。

ChatGPT之后(hòu)又(yòu)一应用杀疯了,AIGC或(huò)进入可控期,将洗牌科技行业?_黑(hēi)料正能量

此外不论是ChatGPT还是AIGC,都离不开庞大算(suàn)力支持。在(zài)关(guān)注各类大模型的发展同时,更(gèng)应(yīng)该关注算力网络(luò)的(de)建设。

算力网络正驱动AI产业发(fā)展进(jìn)入史(shǐ)诗级加速进(jìn)程,让(ràng)AIGC及通用(yòng)AI这一人工智能发展的终极目标离得更近。

因为算力(lì)可以对突破性技术创(chuàng)新(xīn)提供大(dà)力的(de)支持。这方(fāng)面,多模态(tài)大模型是典型。作为面向未来强人工智能、通用人工智(zhì)能的重要技术创新,多模态大(dà)模型已经在人工智能领域提(tí)出了(le)很多(duō)年,业(yè)界也(yě)有不少技术(shù)突破,但是,多模态(tài)大模型进一(yī)步往下走,算力需(xū)求呈几何式(shì)上(shàng)升(shēng),一般(bān)的算力基础设施很快(kuài)将(jiāng)难以胜任。

从图像、文字、语音单独(dú)一项的训练,到双(shuāng)模(mó)态、三模态的(de)跃迁(qiān),让人工智(zhì)能可以灵活应(yīng)对(duì)不(bù)同(tóng)模态的转化、像人与世界交(jiāo)互一样(yàng)自(zì)然(rán),这(zhè)方面(miàn),由算力网络来驱动将有明显优势。

ChatGPT之后又一(yī)应用杀疯了(le),AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正能量

此外,还有(yǒu)很多需(xū)要爆发式增长的算力(lì)来支撑的技(jì)术创新,将(jiāng)在人工智能(néng)算力(lì)网(wǎng)络支撑下快速推进。

AIGC已经露出曙光(guāng),期待在大模型和(hé)大算力的支持(chí)下(xià)AIGC能持续颠覆(fù)内容(róng)生产的(de)方式,将创造的边(biān)际成(chéng)本降低,让万(wàn)众受益。

未经允许不得转载:绿茶通用站群 艾特是什么意思

评论

5+2=