绿茶通用站群绿茶通用站群

山登绝顶我为峰全诗李白,最霸气的十首诗

山登绝顶我为峰全诗李白,最霸气的十首诗 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆以来(lái),微软公司(sī)创始人(rén)比尔·盖茨已多(duō)次(cì)公(gōng)开谈论人工智能话题。在(zài)最近的一(yī)次采访中,他再次表(biǎo)示:“AI可(kě)能会让科技行业迎(yíng)来一次剧烈的洗牌(pái)”。

这个结论是他在当地时(shí)间2月20日(rì)接受《In Good Company》节目专访时提(tí)出的。

他预期,AI的发展可(kě)能会(huì)威胁到谷歌的市占率,因为微软(ruǎn)在AI方面的行(xíng)动相(xiāng)当迅速。而最终(zhōng)科技巨头(tóu)将把AI整合成(chéng)用户的(de)“全能助(zhù)手”,包揽一切应用,与人们进行沟通并提供建(jiàn)议,可以(yǐ)取(qǔ)代亚(yà)马逊(xùn)、Siri或Outlook等(děng)应用。

大佬口中全能助手的到(dào)来可能尚需时日,但(dàn)由ControlNet引发的又一次AI绘画浪潮(cháo),让AIGC在ChatGPT的(de)山登绝顶我为峰全诗李白,最霸气的十首诗话题热点包围(wéi)中杀出重(zhòng)围。

ChatGPT之后又一应用(yòng)杀疯(fēng)了,AIGC或进入可(kě)控期,将洗牌科技(jì)行业?_黑料(liào)正能量(liàng)

01

ControlNet颠覆AI绘画新玩(wán)法

AIGC向可控靠近

以AI绘画为代表(biǎo)的AIGC上一次爆火(huǒ)的时候,还是2022年8月,在美国科罗(luó)拉多州举办(bàn)的新兴数字艺术家(jiā)竞赛中,一幅名为《太(tài)空歌剧院》的作品获奖。

随后(hòu)各大厂商的(de)AI绘画(huà)软(ruǎn)件被广大网友(yǒu)熟知并体(tǐ)验(yàn),Stable Diffusion便是其中(zhōng)代表。

ChatGPT之后又一应用杀疯了(le),AIGC或进入(rù)可(kě)控期,将洗牌科技行业(yè)?_黑料正能量

用户们可(kě)以(yǐ)在应用(yòng)中输(shū)入一组关(guān)键词或者(zhě)一(yī)张照片,就能(néng)获得一幅(fú)AI创作的画作(zuò)。

作(zuò)画(huà)的关键就是所输入的文本(běn)。同一组(zǔ)关键词(cí)也可以创作(zuò)出很(hěn)多张风格不一样的画(huà)作,这让(ràng)创作的过程就像开盲盒。

很多用户很喜欢这种不确定的惊喜(xǐ),他们会将生成(chéng)的美(měi)图当做头像。而另一部分(fēn)喜欢翻看(kàn)AI绘画的“翻车”作(zuò)品。在社交媒体(tǐ)上,许(xǔ)多用(yòng)户分享AI“翻车现场(chǎng)”,例如,一位网友(yǒu)的小狗照(zhào)片被AI画成了“肌肉男(nán)”,还(hái)有网(wǎng)友的个人(rén)照片(piàn)被(bèi)AI识(shí)别(bié)成(chéng)了建(jiàn)筑。

而如今随(suí)着ControlNet的(de)出现与(yǔ)加持(chí),以往AI绘画的填写关键词游戏可能(néng)要被颠覆了。

ChatGPT之后又(yòu)一应用杀疯了(le),AIGC或进(jìn)入(rù)可控期,将洗牌科技(jì)行(xíng)业?_黑料正能量

ControlNet是一位(wèi)正在斯坦福读博的(de)中(zhōng)国人张吕敏创作的一种基于控(kòng)制点的图像变形算法,主要用于数字(zì)图像处理(lǐ)、计算(suàn)机视觉(jué)和计算机图形学(xué)等领域。

其SD插(chā)件一(yī)经发布,在短短(duǎn)的两(liǎng)天内便成为(wèi)了AI绘画领域最新的热点。

在此之前,大家用了很多方(fāng)法想让AI生成的结(jié)果尽可能的符(fú)合要(yào)求,但是(shì)都不尽如人意(yì),它的出(chū)现(xiàn)代表着AI生(shēng)成开始进(jìn)入真正的可控时期。

因为ControlNet可以直接提取画面(miàn)的构(gòu)图,人(rén)物的姿势和画面的深度信息等。有(yǒu)了它的帮助,就不(bù)用频繁的用(yòng)提示词来碰运气(qì),抽(chōu)盲盒式的创(chuàng)作了。

通俗的(de)说ControlNet相当于给AI绘画加了“魔法”,不少博主(zhǔ)的作(zuò)品已(yǐ)经获(huò)得(dé)了大量的浏览量,“viggo”就(jiù)是其(qí)中(zhōng)之一,他用朋友的照片直接带她们走进(jìn)动(dòng)漫世界。

ChatGPT之后又(yòu)一应用杀疯了(le),AIGC或(huò)进入可控期,将洗牌科技行(xíng)业?_黑(hēi)料正能量

viggo先用(yòng)StableDiffusion图片转文字。

再用(yòng)Text2Prompt插件(jiàn)拓展找到对应(yīng)的关(guān)键词;最后用ControlNet插(chā)件绑定(dìng)骨骼开始换关键(jiàn)词(cí)试效果。

ChatGPT之后又一应用(yòng)杀疯(fēng)了,AIGC或进入可控期,将洗牌科技(jì)行(xíng)业?_黑(hēi)料(liào)正能量(liàng)

通过图片(piàn)就可(kě)以看出来,效果十(shí)分(fēn)惊艳。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可控期(qī),将洗牌科技行业(yè)?_黑(hēi)料正能(néng)量

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技行(xíng)业?_黑料正能量(liàng)

更厉害(hài)的是,除了真实的照(zhào)片,草(cǎo)图也可以加上“魔法(fǎ)”,知乎大(dà)牛“DevPoint”和“逗砂”介绍到ControlNet还能实现线稿转全(quán)彩图(tú)。大神张吕敏(mǐn)其本尊也亲自回(huí)应。

ChatGPT之后(hòu)又一(yī)应用杀疯了,AIGC或进入可控期(qī),将洗牌科技行业(yè)?_黑(hēi)料正能量

不(bù)得(dé)不(bù)说当下AIGC已经变得越来越强大,甚至(zhì)输出的作品(pǐn)都已经能以(yǐ)假乱真(zhēn)了。

02

难(nán)辨虚实,AIGC技术力爆发

警惕(tì)安全问(wèn)题

近(jìn)日,“苏州金鸡湖有游艇party”的消(xiāo)息火遍网络,而经过(guò)警方辟(pì)谣这所谓的(de)“party”可能是全国第一(yī)起AI绘图诈骗。

由于这个活动里(lǐ)面给出的美女照(zhào)片都是AI制(zhì)作的真人照片绘图,因为太(tài)逼真,被(bèi)大家当成真(zhēn)事传播了(le)

ChatGPT之(zhī)后又一应(yīng)用杀疯了,AIGC或进入可控期(qī),将洗牌科技(jì)行业?_黑料正能量(liàng)

不过仔细观察可以发现,活动(dòng)发起者提供的照片中有个很大的(de)漏洞可(kě)以发现并非真人,而是(shì)AI绘图(tú),那便是图片中女(nǚ)性的手指部分有的存在异常。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可(kě)控期(qī),将洗牌科技行(xíng)业?_黑料(liào)正能(néng)量

有(yǒu)行业人事表(biǎo)示(shì):“现在因为(wèi)手(shǒu)指(zhǐ)部分的绘画算法比(bǐ)较复杂,AI还不太(tài)会画人的(de)手(shǒu),但最新看到的图片已经有越来越完美的AI模型出现,以(yǐ)后可(kě)能就完全没有漏洞了。

类似的AI作图诈骗(piàn)在国外也已有发生。据(jù)英国广播公司报道,土(tǔ)耳其地震期(qī)间,有(yǒu)Tiktok用户使(shǐ)用(yòng)AI合成了儿童受灾的假(jiǎ)照片(piàn)发布到网络(luò),以此(cǐ)诱骗善良的(de)人(rén)打赏“捐助”从而实施诈骗。

目前随着(zhe)技术发展,AIGC已经能做出真(zhēn)人(rén)照片般(bān)的绘(huì)图效果(guǒ),如果这样的图片(piàn)被用来(lái)诈骗(piàn),将(jiāng)非常可怕(pà)。

此外AIGC还引发了很(hěn)多担忧,一方面,批(pī)判者认为AI在(zài)“学(xué)习”了(le)大量(liàng)前人的作品之(zhī)后,其创作没有(yǒu)任何(hé)情(qíng)绪(xù)和灵(líng)魂,难以和人类的艺术(shù)创作相提并论(lùn)。

另一方面,AIGC背后的版(bǎn)权、目(mù)前都(dōu)并没有得到有效(xiào)的解决,还有AIGC会不会代替人类“至(zhì)高(gāo)无上”的创(chuàng)意。

马斯(sī)克(kè)也强调,人工智能的安全(quán)问题(tí)需要得到(dào)重视,太(tài)晚就来(lái)不及了。

03

AIGC下(xià)一站(zhàn)除了(le)视(shì)频,还有远方

技术都是有两面性的,潜在的危(wēi)害并(bìng)不能(néng)掩(yǎn)盖其光辉的贡献。现在看(kàn)来,人工智能技术(shù)将是第四次工业革(gé)命的(de)核心驱动力量(liàng),将创造新(xīn)的增长奇迹。

过去一年,人工智能(néng)在技术和商业(yè)层面都有了巨大(dà)进展,AI绘(huì)画(huà)就是人(rén)工智(zhì)能(néng)技术发生方向(xiàng)性改变的一(yī)个代表。其下一站或许(xǔ)就(jiù)是(shì)视频。

此(cǐ)前,Meta和谷歌先后(hòu)发(fā)布了几条引爆科技圈的短(duǎn)视频。这些视(shì)频引发关注并非内容做(zuò)得多优秀,反而都非常简(jiǎn)单,比如一匹正在(zài)喝(hē)水(shuǐ)的马,一只(zhǐ)画画的玩(wán)具熊,或者(zhě)一(yī)段骑摩(mó)托(tuō)车的第一视角录像(xiàng),随便(biàn)一个(gè)有手机的(de)人(rén)都可以随(suí)手录下(xià)一段。

ChatGPT之(zhī)后(hòu)又(yòu)一应用杀疯了,AIGC或进入可控期,将洗牌(pái)科(kē)技行业?_黑料正(zhèng)能量

但(dàn)这些(xiē)短(duǎn)视频的(de)创作方(fāng)式非常(cháng)简单(dān),创作者仅仅需要向AI输(shū)入一段话,甚至只是说一下要求,AI就可以根据需要生(shēng)成一段视频(pín)。

谷(gǔ)歌发布的两(liǎng)个AI生成视(shì)频(pín)分别来(lái)自于Imagen Video和Phenaki,前者主要(yào)突出的是(shì)高清,与Meta的Make-A-Video没有(yǒu)太(tài)多的差(chà)别。

在Make-A-Video公布了(le)AI生成的(de)视频(pín)后,AI圈就已经玩了一波(bō)梗,一(yī)个能够做出更高清视频的AI还不足以在短时间内戳中(zhōng)兴奋点(diǎn)。

Phenaki更加令人震惊的地方在于(yú),它可以制作出超(chāo)过2分钟的(de)连贯的也有确切内容的视频,这才是真正让人们(men)感到惊喜的地方(fāng)。因为无论AI生(shēng)成的视频(pín)多么高清,也只能是(shì)为内容生产者提供一个灵感(gǎn),一个素材,一个过场动画。

不(bù)过能够(gòu)制(zhì)作出(chū)有(yǒu)具(jù)体剧情内(nèi)容的视频就(jiù)意(yì)味着,一些视(shì)频(pín)创作由(yóu)AI代(dài)替人(rén)工完成(chéng)已经初步有了可能。

当下AI的(de)发(fā)展速度已经(jīng)超过大部(bù)分人的想象。内容(róng)产业的(de)本质(zhì)是供给创造(zào)需求,AIGC作为全新(xīn)的(de)内容生产(chǎn)方式(shì),可以为内容产业(yè)带来更新(xīn)的(de)内容(róng)风格(gé)、更快的生产(chǎn)速度(dù),更低(dī)的生产成本(běn),这无疑会驱(qū)动内容产业的大爆(bào)发。

除了AI绘图、视频,AIGC技术(shù)还能应用于音乐、代(dài)码、机器人动作(zuò)等多种(zhǒng)内容形式的生成。不难(nán)发现该(gāi)项技(jì)术不仅在游戏等行(xíng)业能得到有(yǒu)效应用,对(duì)于下一代互联网各种元素的构(gòu)建(jiàn)亦(yì)有关(guān)键(jiàn)意义(yì)。

从商业化(huà)的(de)角(jiǎo)度来(lái)看,文化娱乐(lè)、教育、传媒等诸多(duō)领域,本身就对基于AI的可视化内容有(yǒu)强烈需求(qiú)。

因此,AI绘画及(jí)视频或(huò)不是(shì)结果,而只是(shì)AI进程中的一块(kuài)重(zhòng)要(yào)拼图,有望在技术更(gèng)新的(de)加持下实(shí)现更大的应(yīng)用价值(zhí)。

AI从理(lǐ)解内容(róng),走(zǒu)向(xiàng)了(le)可(kě)以(yǐ)生成内容,甚至能够创造出独立价值(zhí)和独立(lì)视角的(de)内容。AIGC的再次出(chū)圈,更代(dài)表着未来的先(xiān)进(jìn)生产力即将到来(lái)。

ChatGPT之后又一应(yīng)用杀疯了(le),AIGC或进入可控期,将洗(xǐ)牌科(kē)技行业?_黑料(liào)正能(néng)量(liàng)

04

紧抓大模型与(yǔ)算力,牢固(gù)AIGC底座(zuò)

从技术的发展(zhǎn)也可以看(kàn)出,在(zài)语(yǔ)言大模型、图像(xiàng)大(dà)模型之(zhī)后(hòu),多模(mó)态大模型已经(jīng)成为(wèi)了新(xīn)的趋势。

大模型(xíng)被誉(yù)为当前人(rén)工智能(néng)发展的(de)智能(néng)底座(zuò),是全球竞争最激(jī)烈的研究方向之(zhī)一,包括(kuò)谷(gǔ)歌、亚马逊、百度、阿(ā)里、腾讯等众多(duō)头部企业都在竞(jìng)相(xiāng)发力(lì)。

不过训(xùn)练大(dà)模型的确价格不(bù)菲,以国盛证券发(fā)布的《ChatGPT需要多少算力》报(bào)告估算,GPT-3训(xùn)练一(yī)次(cì)的成本约(yuē)为140万美元。而对于一些更大的LLM(大(dà)型(xíng)语言(yán)模型),训练成本(běn)则(zé)介于200万美元(yuán)至1200万美(měi)元高(gāo)价之间。

以ChatGPT在2023年1月的独(dú)立访(fǎng)客平均数1300万计算,其对应芯片需求为(wèi)3万多片(piàn)英伟达A100 GPU,初始(shǐ)投入成本约(yuē)为8亿美元(yuán),每日仅电费就(jiù)在5万(wàn)美(měi)元左右(yòu)。

ChatGPT之后(hòu)又一应用杀疯了(le),AIGC或进入可控期,将(jiāng)洗牌科技行(xíng)业?_黑(hēi)料正能量

此外(wài)不论是ChatGPT还是AIGC,都离不开庞大(dà)算力支持。在关(guān)注各(gè)类大模型的发展同时,更(gèng)应(yīng)该关注(zhù)算力网络(luò)的建设。

算力网络正驱动(dòng)AI产业发展进入史诗级加速进程,让AIGC及(jí)通用AI这一(yī)人工智能(néng)发展的终(zhōng)极目标离得更近。

因(yīn)为算(suàn)力可以对突破性技术创(chuàng)新(xīn)提供大(dà)力(lì)的支持。这方面,多(duō)模态大模型是典型。作(zuò)为(wèi)面向未(wèi)来强人工(gōng)智能(néng)、通用人工智能的(de)重要技术(shù)创新,多模态大(dà)模型已经在(zài)人(rén)工智能领域提出了很多年,业界也(yě)有不少技术突破,但是,多模态(tài)大模型进一步往下走,算力需求(qiú)呈几何式(shì)上升(shēng),一般的算力(lì)基础设施很快将难(nán)以胜任。

从图像、文(wén)字、语音单(dān)独一项的训练,到双模态、三模态的(de)跃迁,让人工(gōng)智能可以灵活应对不同模态的转(zhuǎn)化、像人与世界交互一样自然,这方面,由算力网络来驱动将有明显优势。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑(hēi)料(liào)正能量(liàng)

此外,还有很多(duō)需要爆发式增长(zhǎng)的算(suàn)力来(lái)支撑(chēng)的技术创新,将在人工(gōng)智(zhì)能算力(lì)网络支撑(chēng)下快速推进。

AIGC已经(jīng)露出曙光(guāng),期(qī)待(dài)在大模型和(hé)大算力的(de)支持下AIGC能持续颠覆内容生(shēng)产的方式,将创造的边际成本降低,让万众(zhòng)受(shòu)益。

未经允许不得转载:绿茶通用站群 山登绝顶我为峰全诗李白,最霸气的十首诗

评论

5+2=