绿茶通用站群绿茶通用站群

两丈等于多少米

两丈等于多少米 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天(tiān)机(jī)器人ChatGPT火(huǒ)爆以来(lái),微软公司创始人(rén)比尔(ěr)·盖茨已多次(cì)公开(kāi)谈论人工(gōng)智(zhì)能话题。在最近的一次(cì)采(cǎi)访(fǎng)中,他再(zài)次表(biǎo)示:“AI可能会让科技行业迎(yíng)来(lái)一次剧烈的(de)洗牌”。

这(zhè)个结论(lùn)是(shì)他在(zài)当地时间(jiān)2月20日接受(shòu)《In Good Company》节目专访时提出的。

他预期(qī),AI的发展可(kě)能会威胁到(dào)谷歌的市占率(lǜ),因为微软在AI方(fāng)面(miàn)的行动相当迅速。而(ér)最终科技巨(jù)头将把AI整合成用户的“全能助手”,包揽一切应用,与人们(men)进行沟通(tōng)并提供建议,可以(yǐ)取代亚马逊、Siri或Outlook等应(yīng)用。

大佬口(kǒu)中(zhōng)全能助手的到来(lái)可能尚需时日,但由(yóu)ControlNet引发(fā)的(de)又一(yī)次AI绘画(huà)浪潮,让AIGC在ChatGPT的话(huà)题(tí)热点包围中杀出重(zhòng)围(wéi)。

ChatGPT之后又一(yī)应(yīng)用杀疯了,AIGC或(huò)进入可控期,将洗牌(pái)科(kē)技行业?_黑料正能量

01

ControlNet颠覆AI绘画新玩(wán)法(fǎ)

AIGC向(xiàng)可控靠(kào)近(jìn)

以AI绘画为代表的AIGC上一(yī)次爆火的时候(hòu),还是(shì)2022年8月,在美国(guó)科罗(luó)拉多(duō)州举办的新兴数(shù)字艺术家竞赛中,一幅名为《太(tài)空歌剧院》的(de)作品获奖。

随后各大厂商(shāng)的AI绘画软件被广大网友熟知并体验,Stable Diffusion便是(shì)其中代表。

ChatGPT之后又一应用杀疯了(le),AIGC或进入可(kě)控期,将洗牌科(kē)技行业?_黑料正(zhèng)能量

用户们可以在应用中(zhōng)输入一组关键(jiàn)词或者一张照片,就能获(huò)得一幅AI创作的画作(zuò)。

作画(huà)的关(guān)键就是所输入的文本。同(tóng)一组关键(jiàn)词也可以创(chuàng)作出很多(duō)张风格(gé)不一样的画作,这让创作的过(guò)程就像开盲盒。

很多(duō)用户很喜(xǐ)欢(huān)这种不确定的惊喜,他们会(huì)将生成的美图当做(zuò)头(tóu)像。而另一部分喜(xǐ)欢翻看AI绘画(huà)的“翻车”作品。在社(shè)交媒体上,许多用户(hù)分享(xiǎng)AI“翻车现场”,例如,一位网友的小狗(gǒu)照片被AI画成了“肌肉(ròu)男(nán)”,还有(yǒu)网(wǎng)友的(de)个人照片(piàn)被AI识(shí)别成了建筑。

而如今(jīn)随着ControlNet的出现(xiàn)与(yǔ)加持,以往AI绘画(huà)的填写关(guān)键词游戏可能要被颠(diān)覆了(le)。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可(kě)控期,将洗牌科技行业?_黑料正(zhèng)能量

ControlNet是(shì)一位正在斯坦福读博的中国(guó)人张吕敏创作的一种基于控制点(diǎn)的图像(xiàng)变形算法(fǎ),主要用(yòng)于(yú)数字(zì)图像处理、计算机视觉(jué)和计(jì)算(suàn)机图形学等(děng)领域。

其SD插(chā)件一经发布,在(zài)短短的两天(tiān)内便(biàn)成为了AI绘画(huà)领域最新的热点(diǎn)。

在(zài)此之前,大家用了很多方法想让AI生成的结(jié)果尽可能的符(fú)合(两丈等于多少米hé)要求,但(dàn)是都不尽如人意,它的出现代表(biǎo)着AI生成(chéng)开始进入真(zhēn)正的可控(kòng)时期。

因为ControlNet可以直(zhí)接提取画(huà)面的构图(tú),人物的姿势(shì)和画面的深(shēn)度信息等。有了(le)它的帮助(zhù),就(jiù)不用(yòng)频繁的用提示(shì)词来碰运气,抽盲盒(hé)式的创作(zuò)了。

通(tōng)俗的(de)说ControlNet相(xiāng)当(dāng)于给AI绘画加(jiā)了“魔法”,不少博主的作品已经获得了大量的(de)浏览量,“viggo”就是其中之(zhī)一(yī),他用朋友(yǒu)的照片(piàn)直接带她们走进动漫世界(jiè)。

ChatGPT之后(hòu)又(yòu)一(yī)应用(yòng)杀疯了,AIGC或(huò)进入(rù)可控期,将洗(xǐ)牌科技行业?_黑料(liào)正能量

viggo先用StableDiffusion图片转文(wén)字。

再用Text2Prompt插件拓展找到(dào)对(duì)应的关键词;最后(hòu)用ControlNet插(chā)件绑定骨骼开始换关键(jiàn)词试效果(guǒ)。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入(rù)可控期,将洗牌科(kē)技行业?_黑(hēi)料正能量

通过图片就可以看出来,效果十分(fēn)惊艳。

ChatGPT之后(hòu)又一应用杀(shā)疯了,AIGC或进入可控期(qī),将(jiāng)洗牌(pái)科技行业?_黑料(liào)正能(néng)量(liàng)

ChatGPT之(zhī)后又(yòu)一应(yīng)用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技(jì)行业?_黑料正(zhèng)能量

更(gèng)厉害(hài)的(de)是,除了真实(shí)的照(zhào)片,草(cǎo)图也(yě)可以加上“魔法”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还能(néng)实现线稿(gǎo)转全彩图。大神(shén)张吕敏(mǐn)其本尊(zūn)也亲自(zì)回应。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入(rù)可(kě)控期,将洗牌科技行业(yè)?_黑料正能量

不得不说当下AIGC已经变得越来(lái)越强大,甚至输出(chū)的(de)作品都(dōu)已(yǐ)经能以假(jiǎ)乱真了。

02

难辨虚实,AIGC技术力爆发

警(jǐng)惕安全问题

近日,“苏州金鸡湖有(yǒu)游艇party”的消息(xī)火遍网(wǎng)络,而经过警方辟谣(yáo)这所谓的(de)“party”可能是全国第一起AI绘图诈骗。

由于这个(gè)活动里面(miàn)给出的美女照片都是AI制作(zuò)的真人(rén)照片绘图(tú),因(yīn)为太逼真,被大家当成真事传播了

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或进入可控期,将(jiāng)洗牌科(kē)技(jì)行业?_黑料正(zhèng)能量

不过仔细观(guān)察可以发(fā)现,活动发起者(zhě)提供的(de)照片中有(yǒu)个(gè)很大(dà)的漏洞可以(yǐ)发现并(bìng)非真人,而(ér)是AI绘图(tú),那便(biàn)是(shì)图(tú)片中女性的(de)手指部分有的存在异常。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入(rù)可控期,将洗牌(pái)科技行(xíng)业?_黑料(liào)正能量

有(yǒu)行业人事表示:“现在因为手指(zhǐ)部(bù)分的(de)绘画算法比较(jiào)复杂,AI还(hái)不太会画(huà)人的手(shǒu),但最(zuì)新看(kàn)到的图片(piàn)已经(jīng)有越来越(yuè)完美的AI模型(xíng)出现,以(yǐ)后(hòu)可能就完全没有漏洞(dòng)了(le)。

类似(shì)的AI作图诈骗(piàn)在国外也已有(yǒu)发生。据英国(guó)广(guǎng)播公司(sī)报道,土耳其(qí)地震(zhèn)期间(jiān),有Tiktok用户使用AI合(hé)成了儿(ér)童受灾(zāi)的(de)假照(zhào)片(piàn)发布(bù)到网络(luò),以此诱骗善良的(de)人打赏“捐助”从(cóng)而实(shí)施诈(zhà)骗。

目(mù)前随着技术发展(zhǎn),AIGC已经能做出(chū)真人照片般的绘图(tú)效果,如果这(zhè)样(yàng)的图片被用来诈(zhà)骗,将非常可怕。

此外AIGC还引(yǐn)发(fā)了很多担忧,一方面(miàn),批判者认(rèn)为AI在“学习”了大量前人(rén)的作品之后,其创作没有任何情绪和灵(líng)魂,难以和(hé)人类的艺术(shù)创作相提并论(lùn)。

另一(yī)方面(miàn),AIGC背后的版权、目前都并没有(yǒu)得(dé)到有效的解决,还有(yǒu)AIGC会不会(huì)代替人(rén)类“至高无(wú)上(shàng)”的创意。

马斯克也强调,人工智能的安全问题需要(yào)得到重视,太(tài)晚就来不(bù)及了。

03

AIGC下(xià)一站除了视频,还有远方(fāng)

技术都是(shì)有两面性的,潜在的危害(hài)并不能掩(yǎn)盖其光辉的贡献。现在看来,人(rén)工智能技(jì)术将是第四次工业(yè)革(gé)命的核(hé)心驱动(dòng)力量,将创造新的增长奇(qí)迹。

过去一年,人工智能在(zài)技术和(hé)商业(yè)层面都有了巨大进(jìn)展,AI绘画(huà)就是人工智能技术发生(shēng)方(fāng)向性改变的一(yī)个代表。其下一(yī)站(zhàn)或许就是视频。

此(cǐ)前,Meta和谷歌先后发布(bù)了几条引爆(bào)科(kē)技圈的短视频(pín)。这些(xiē)视(shì)频引发关注并非内容做得多优(yōu)秀(xiù),反而都非常简单,比如一匹(pǐ)正在喝水(shuǐ)的(de)马,一只画(huà)画(huà)的玩具熊(xióng),或者一段骑摩托车(chē)的第一(yī)视(shì)角录像,随便一个有手机的人都可以随(suí)手录(lù)下一段。

ChatGPT之后又一应用杀<span style='color: #ff0000; line-height: 24px;'><span style='color: #ff0000; line-height: 24px;'><span style='color: #ff0000; line-height: 24px;'>两丈等于多少米</span></span></span>疯了(le),AIGC或进入可控(kòng)期,将洗牌(pái)科技行业?_黑料正能量

但(dàn)这些短(duǎn)视频的创作方式(shì)非常简(jiǎn)单,创作者仅仅需(xū)要向(xiàng)AI输入一段话(huà),甚至只是说一下要求,AI就可(kě)以(yǐ)根据需要生成一段视频。

谷(gǔ)歌发布(bù)的两个AI生成视频分别来自于Imagen Video和Phenaki,前(qián)者主要突(tū)出(chū)的(de)是高清,与Meta的Make-A-Video没有太(tài)多的差别。

在Make-A-Video公布了AI生成的视频后,AI圈就已经玩了一波梗,一个能够(gòu)做出更(gèng)高清视(shì)频(pín)的AI还(hái)不足以在短时间内(nèi)戳中兴奋点。

Phenaki更加令人震惊的地方在于(yú),它可以制作出超过2分钟的连贯的也有(yǒu)确切内容(róng)的视频,这才(cái)是(shì)真正让人(rén)们(men)感到惊喜(xǐ)的地方。因为(wèi)无(wú)论AI生成的视频(pín)多(duō)么高(gāo)清,也只能是(shì)为内容生(shēng)产者提供(gōng)一个灵感,一个素材,一个过场动画(huà)。

不过能够(gòu)制作(zuò)出有具体(tǐ)剧情内容的(de)视(shì)频就(jiù)意味着,一些视频创作(zuò)由(yóu)AI代替人工完成已经初步有(yǒu)了可能。

当(dāng)下(xià)AI的发展速度已经(jīng)超过大部分人的想(xiǎng)象。内(nèi)容产(chǎn)业的本(běn)质(zhì)是供给创(chuàng)造需求,AIGC作为(wèi)全(quán)新的内容生产(chǎn)方(fāng)式,可以(yǐ)为内容(róng)产(chǎn)业带(dài)来更新的内容风格、更(gèng)快的(de)生(shēng)产速度,更(gèng)低(dī)的(de)生产(chǎn)成(chéng)本,这无疑会驱动内容产业的(de)大爆发。

除(chú)了AI绘图、视频,AIGC技(jì)术还能应(yīng)用于音乐、代码、机(jī)器(qì)人动作等多种内容形式(shì)的生成。不难发现该项(xiàng)技术不仅在游戏等(děng)行(xíng)业(yè)能(néng)得(dé)到有(yǒu)效应用,对于下一代互联网(wǎng)各(gè)种元素的构建亦有关键意义(yì)。

从商业(yè)化(huà)的(de)角度来看,文化(huà)娱(yú)乐、教育、传媒等诸多领域,本身就对基于AI的可视(shì)化内(nèi)容有(yǒu)强烈需求。

因此,AI绘画(huà)及视频或(huò)不是结果,而只是AI进程中的一块(kuài)重要(yào)拼(pīn)图,有望在技术更(gèng)新(xīn)的加持(chí)下实现更大的(de)应用价值。

AI从理解内容(róng),走向了可以生成内容,甚至(zhì)能够创造出独立价(jià)值和独立视(shì)角的内(nèi)容。AIGC的再次出圈,更代表着未(wèi)来的先进(jìn)生(shēng)产(chǎn)力即将到来。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可控期,将(jiāng)洗牌科(kē)技行业?_黑料正能量

04

紧抓大模型与(yǔ)算(suàn)力(lì),牢(láo)固AIGC底座(zuò)

从技术的发展也可以看出,在语言大模(mó)型(xíng)、图像大模型之后,多模态(tài)大模型(xíng)已经成为了新的趋势。

大模型被誉为当前人(rén)工智能发展的(de)智能底座,是(shì)全球竞争最激(jī)烈的研究方向之一,包括谷歌、亚马(mǎ)逊、百度(dù)、阿里(lǐ)、腾讯(xùn)等众(zhòng)多头(tóu)部企业都在竞相发力。

不过训练大(dà)模型的确价格不菲,以国盛证券发(fā)布(bù)的(de)《ChatGPT需要多少算力》报告估(gū)算,GPT-3训练一次的成本约为(wèi)140万(wàn)美元。而(ér)对于一些更大的LLM(大型语言模型(xíng)),训练成本则介(jiè)于(yú)200万美元至1200万(wàn)美元高(gāo)价之(zhī)间(jiān)。

以ChatGPT在2023年(nián)1月的独立访客平均数1300万计(jì)算,其对应芯(xīn)片(piàn)需求为3万多片英(yīng)伟达(dá)A100 GPU,初始投入(rù)成本(běn)约为8亿美元,每日(rì)仅电费就(jiù)在5万美元左右。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或(huò)进(jìn)入(rù)可控(kòng)期,将洗(xǐ)牌科(kē)技行业?_黑料正能量

此(cǐ)外不论是(shì)ChatGPT还是(shì)AIGC,都(dōu)离不开庞大算力支持。在(zài)关(guān)注(zhù)各类大模(mó)型的发(fā)展同时,更应该关注(zhù)算力网(wǎng)络(luò)的建设。

算力网络正驱动AI产业发展进入史诗级加(jiā)速进程,让AIGC及通用AI这(zhè)一人(rén)工智能(néng)发(fā)展的(de)终极目标(biāo)离得(dé)更近。

因为算(suàn)力(lì)可以对突破性技(jì)术创新(xīn)提供大(dà)力的支持。这方面,多模态大(dà)模型是典型。作为(wèi)面(miàn)向未(wèi)来(lái)强人工智能、通用(yòng)人(rén)工智能的重要(yào)技术创新(xīn),多(duō)模态(tài)大模型已经在人工智能领域提出了(le)很多年(nián),业界也有不(bù)少(shǎo)技(jì)术突破,但(dàn)是,多模态大模型进一步往(wǎng)下走,算力需(xū)求呈几何式上升(shēng),一般的算力基础设施很(hěn)快将难以胜(shèng)任(rèn)。

从图像、文字、语音单独一项的训练,到(dào)双模(mó)态(tài)、三模态的跃迁,让人工智(zhì)能可以(yǐ)灵活应(yīng)对不(bù)同模态(tài)的(de)转化、像人与世界交互一样自然,这方面(miàn),由算力网络来驱动将有明显优势(shì)。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可控(kòng)期,将洗牌科(kē)技行(xíng)业?_黑(hēi)料正能量

此外,还有很多需要爆(bào)发(fā)式增长的算力来支撑(chēng)的技(jì)术创新,将在人工(gōng)智(zhì)能算力网络支撑(chēng)下快速推(tuī)进。

AIGC已经露出(chū)曙光(guāng),期待在大模型和(hé)大算力(lì)的(de)支持下AIGC能持续(xù)颠(diān)覆(fù)内容(róng)生产的方式,将(jiāng)创造的边际成本降低,让(ràng)万众受益(yì)。

未经允许不得转载:绿茶通用站群 两丈等于多少米

评论

5+2=