绿茶通用站群绿茶通用站群

Meta继续押宝开源大模型 Llama 3拿下“赛点”?

Meta继续押宝开源大模型 Llama 3拿下“赛点”?

开源与闭源之争(zhēng)延续到大模型时代(dài)。在寻找“新(xīn)大(dà)陆”的路上(shàng),开源与闭源的辩论,就像(xiàng)是一 场关于AI未来的“航海策略”讨论。

开源一(yī)派认为,开源能够促进全球科研人员和开发者的协作,加速AI技术的迭(dié)代与创新。同(tóng)时,开源让更多人参与到模型的改进(jìn)和优化中(zhōng),通(tōng)过集体智慧解决复杂的技术难题。

闭源的倡导者则看重其在商业(yè)化、技术保(bǎo)护和(hé)产品差异(yì)化方面的优势。闭(bì)源模型使(shǐ)得企业能够(gòu)控制产品的开发节奏和(hé)市场策略(lüè),保护(hù)其商(shāng)业 利(lì)益(yì)。此(cǐ)外,闭(bì)源也有(yǒu)助于企(qǐ)业维护(hù)其技(jì)术优势,避免(miǎn)竞争对手模仿或超越。

Llama 3的发布让开源大模型在与闭源的竞争中再度(dù)“扳回(huí)一(yī)城”。从测试结果来看,Llama 3的成绩大幅超越了Llama 2,也(yě)胜(shèng)过(guò)了GPT-3.5。

在AI这场没有硝烟(yān)的“航海竞赛”中,大模(mó)型已然成为(wèi)眼前的灯(dēng)塔。未知的是,这座(zuò)灯塔究竟是(shì)向所有 航海者开(kāi)放其光芒,还是仅为(wèi)特定的船只照亮前行的航道。

开(kāi)源在(zài)开(kāi)发者(zhě)和研究人员中极受欢迎

Meta正沿着开源路径继续(xù)前进。

近日,Meta推出开源大模型(xíng)Llama 3系列,发布8B和70B两个版本。Meta创始人(rén)兼首席执行官扎克(kè)伯格在同一天宣布,基于Llama 3,Meta的AI助手现在已(yǐ)经覆盖(gài)Instagram、WhatsApp、Facebook等全系应(yīng)用,并(bìng)单独开(kāi)启了网站。

与Llama 2相比,Llama 3进(jìn)行了几项 关键的(de)改进:使用具128K token(输入数据的最小单元)词汇表的tokenizer(编译器),可以更(gèng)有效地编(biān)码语言,从(cóng)而显著(zhù)提升模型性能;在8B和70B模型中都采用分组查询注意力(GQA),以提高Llama 3模型的推理效率;在8192个token的序列上训练模(mó)型,使(shǐ)用(yòng)掩码来确保自注意力(Self-Attention)不会跨越文档(dàng)边(biān)界。

据Meta介(jiè)绍,Llama 3已经在多种行业基(jī)准(zhǔn)测试上展现了(le)最先进的性能,提(tí)供了包括改 进(jìn)的推理能力(lì)在内的新功能,是目前市场(chǎng)上最好的(de)开源大模型。

此外,Llama 3发布后,微软Azure、谷歌云(yún)、百度智能云等陆续宣布(bù)其平台(tái)上线Llama 3。百度方(fāng)面此(cǐ)前对《每日经济新闻》记者表示,百度智能云千帆大模型平(píng)台(tái)在国内首家推(tuī)出针对(duì)Llama 3全系列版本的(de)训练推理方案(àn),便于开发者(zhě)进行再训练,搭建专(zhuān)属大模型。

工业和信息化部工业文化发展中心(xīn)AI应用工作组执行组长(zhǎng)、行行(xíng)AI董事(shì)长李明顺在接受(shòu)《每日经济新闻》记者(zhě)采访 时表示,Meta的Llama 3发布可能会带来更多AI应用落地机会和场(chǎng)景,它通过提供(gōng)更大词(cí)汇量的Token词典、更长(zhǎng)的(de)输入上 下文长度以及优(yōu)化的模型结构,增强了模型的(de)编码效率和推理效率。“现在,比 起Llama 2,Llama 3在代码(mǎ)能力和(hé)逻辑推理能力(lì)上有显著提升,这可能会促进(jìn)相关AI应用的性能(提升),尤其是在需要(yào)复杂逻辑和代码理解 的 场景中去落地。”

OpenAI在GPT-2之后调转船头走向闭源,Meta则成为(wèi)开源界的引领者之(zhī)一。

从2020年发(fā)布GPT-3,到引(yǐn)发轰动的GPT-3.5,以(yǐ)及(jí)2023年3月发布的(de)GPT-4,都是闭源模型。此前,马斯克起诉OpenAI时曾直言(yán):“如果OpenAI改名为ClosedAI,我就(jiù)撤销诉(sù)讼。”

李明顺认为(wèi),OpenAI的转变可能(néng)与其商业(yè)战略和(hé)市 场定位有关。“初期开 源有助于快速吸引关注和社区(qū)参与,但随着公司的发展,我估(gū)计阿尔特(tè)曼(Sam Altman)的野心和(hé)商业梦想越来越膨(péng)胀了,闭源可(kě)以更好(hǎo)地让它融资,包括和微软(ruǎn)合作(zuò),保护领先(xiān)的(de)技术优势。”他表示,从OpenAI的转变中可以看出,开源与闭源(yuán)的选择并非固定不变,而是需要根据公司战略目标、市(shì)场环(huán)境和产品发展阶段灵活调整。天下没什么事情是绝对的(de),很多开源公司也是拿着(zhe)次优代码开源,独家秘(mì)方闭源。

在追逐AGI(通用(yòng)人工智(zhì)能)这颗明(míng)珠的道路上,迄今为(wèi)止,Meta依旧持续沿(yán)着开源的路径前(qián)行。

2024年初,扎克伯格在Meta第四季度及2023全(quán)年财(cái)报电(diàn)话会议上表示(shì):“长期以来,我(wǒ)们(men)的策略是构建并开放源代码(mǎ)通用基础(chǔ)设施,同时保留我们 的具体产品(pǐn)实现为专有(yǒu)技术。”

他 认(rèn)为,开源带来(lái)了(le)几个战(zhàn)略好处。首先,开(kāi)源软件通(tōng)常更加安全(quán)非洲患者以为青蒿素是“印度神药”,中国该如何夺回话语权?可靠,并且因为(wèi)社区的持续反馈(kuì)、审查和开发,更加高效。其次,开源软件经常成为行业标准,“当企业(yè)开(kāi)始(shǐ)基于我们(men)的技术栈建立(lì)标准时,这使得将创新融入我们的产(chǎn)品变得(dé)更加容易。这(zhè)种微妙的优势,能够迅 速(sù)学习和改(gǎi)进(jìn),是巨大的(de)竞争优势(shì),而成为行业标(biāo)准正是这一能力的关键”。第三,开源(yuán)在开发者和研究人员中极受欢迎。

开源与(yǔ)闭源(yuán)并不矛(máo)盾

开源还是闭源,也许是全球人工智能信徒(tú)长久的(de)辩题(tí)。在Llama 3诞生前几天,国内同样在进行(xíng)一场“辩论”。

4月11日,百度董事长兼首席执行官李彦宏在其内部讲话中直言,大模型开源的意义不(bù)大,闭源模型在能(nén非洲患者以为青蒿素是“印度神药”,中国该如何夺回话语权?g)力上会持续领先,而不是一时领先,做模型的创业(yè)公司既做模型又做 应用(yòng)的“双(shuāng)轮驱(qū)动”不是一个好的模式。在一周后的Create 2024百度AI开发者大会上,李(lǐ)彦宏再度提到,大家以前用开(kāi)源觉得(dé)开源便宜(yí),其实(shí)在大模型场景下,开(kāi)源是最贵的,所以开源模型(xíng)会越来越落后。

360公司创始人周鸿祎则(zé)持不同的观点。他表示:“网上有些名(míng)人胡说八道,大家(jiā)也别被他(tā)们忽悠,说开源不如闭源好。一句话,今(jīn)天没有开源就没(méi)有(yǒu)Linux(操(cāo)作系(xì)统(tǒng)内(nèi)核),没有Linux就没(méi)有互联网(wǎng),就连说这(zhè)话的公司自己都借助了开源的力量才成(chéng)长到今天。”

这段发言被解读(dú)为对李彦宏(hóng)观点(diǎn)的回怼,周鸿祎(yī)随后澄清道:“我一直是开源的信徒,但是我说开源(yuán)好,是(4月)13日在(zài)哈佛讲的,李厂长(指李彦宏)说闭源(yuán)好,是(4月)16日在北京讲的。”

生数(shù)科技(jì)联(lián)合创始人兼CEO唐家渝站(zhàn)在闭源的(de)一边。在(zài)4月18日(rì)举行的“2024中国生成式AI大会(huì)”上,唐家(jiā)渝表示:“在我们看来,开源、闭(bì)源都有各自可以(yǐ)做的商业生态,但是从模型能力的(de)提升来说,或者持续走到 前列来说,闭源还是会走到开源的前面。”

昆仑万维董事 长方汉的观点是,开源(yuán)模型与闭源 模型之间(jiān)的差距正在不断缩小(xiǎo)。4月16日,方汉在接(jiē)受(shòu)《每日经济新闻》记者在内的媒 体采(cǎi)访时表示,闭源模(mó)型的确是第一,但(dàn)是(shì)开源大模型在2023年到今年这一年间(jiān),从落后两年(nián)以上,已经进化(huà)到落后4~6个月以上。

此外,方汉认为,在应用侧,闭(bì)源(yuán)对于产品特(tè)性和长(zhǎng)尾需(xū)求的满足都落后于开源大模(mó)型,开(kāi)源(yuán)大(dà)模型是一种生态构建器(qì),更利于满足用(yòng)户的长尾需求。开源大模型和闭源大模型是一个生态的组成部分,不是谁压倒谁,大家都有自己的(de)生(shēng)存空间,也都有(yǒu)更好的明(míng)天。

不过(guò),从商业化上来讲,闭源和开(kāi)源也许并(bìng)不(bù)矛盾。启(qǐ)明创投合伙人周志峰就认(rèn)为,开源闭源在过(guò)去几个大浪潮当中没有很大的冲突 ,不太理解为什么很(hěn)多人(rén)把闭源、开源在AI时代看成对立的(de)。

李明(míng)顺(shùn)的观点则是,在当前强应用导向 的背景下,开(kāi)源模(mó)式具有(yǒu)显著优势,能够吸引全球范(fàn)围内(nèi)最广泛的人参与,从而使其创新性保持(chí)在较高水平(píng)。

相较(jiào)之(zhī)下,尽管一些闭源大模(mó)型在技术上具有领(lǐng)先地(dì)位,但其(qí)成本太高。不过(guò)他也强调,开(kāi)源与闭源在不同公司(sī)和应用(yòng)场景中可(kě)以相互转换。一(yī)些(xiē)基于(yú)开(kāi)源的产品(pǐn)在发掘到独特优势后,可能会(huì)通(tōng)过(guò)闭源策略建立竞争壁垒。同时,一些闭源公司也会不断将其(qí)部分产品(pǐn)开源。这两(liǎng)个应该是 共存的,未来开源可能用户量级上更大,但是行业内,商业化做得比较好的公司,往往还是闭源的多一点。

在开源与(yǔ)闭源的辩论中,也许答案并非非(fēi)此即彼。AI的未来可(kě)能既不是完全开放的“自由港 ”,也不是彻(chè)底封闭的“孤岛”,而(ér)是(shì)一个既包含(hán)开放协作也包(bāo)含封闭竞争的混合生态。在这个生态系统中(zhōng),开放与封闭不是对立的两极,而是一枚硬币的两面。

未经允许不得转载:绿茶通用站群 非洲患者以为青蒿素是“印度神药”,中国该如何夺回话语权?

评论

5+2=