導(dǎo)語:應(yīng)用的進(jìn)步,可以推動基礎(chǔ)模型的創(chuàng)新
文?|?陳世鋒
2024年5月22日,第八屆VivaTech在法國巴黎凡爾賽門展覽中心隆重舉行。會議期間,來自全球各地的參會者們認(rèn)真傾聽數(shù)百個獨一無二的創(chuàng)意,不斷激發(fā)科技改變世界的夢想,氣氛非常熱烈。
VivaTech全稱Viva Technology,是歐洲最大科技創(chuàng)新盛會,堪稱歐洲AI春晚。歷屆大會中,法國總統(tǒng)均到場出席,谷歌、微軟、IBM、三星、特斯拉等各個科技巨頭的董事長和CEO也是大會???。
作為世界領(lǐng)先的科技和創(chuàng)新展覽之一,2023年第七屆VivaTech大會吸引了來自174個國家的15萬名參觀者、1.14萬家初創(chuàng)企業(yè)和2800家參展商,同時還有40.5萬人通過網(wǎng)絡(luò)在線觀展,9億多社交媒體用戶關(guān)注。
目前正在召開的第八屆VivaTech大會,有超2500家初創(chuàng)企業(yè)和2000名國際投資者,25個行業(yè)和350多家公司和組織參與,全球多個明星公司和頂級嘉賓出席,包括特斯拉CEO馬斯克、圖靈獎得主Yoshua Bengio、Meta首席科學(xué)家Yann LeCun、Anthropic首席執(zhí)行官Dario Amodei、法國AI獨角獸Mistral AI CEO Arthur Mensch、Salesforce AI CEO Marc Benioff等一眾AI大佬,法國總統(tǒng)馬克龍也應(yīng)邀參會。
值得關(guān)注的是,中國展區(qū)將作為本屆VivaTech亮點之一重磅回歸,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏作為大會唯一受邀發(fā)言的中國AI領(lǐng)袖,在主論壇“爐邊談話”與VivaTech聯(lián)合總裁展開對話。VivaTech大會的推文中,將李彥宏稱為“長期的AI支持者”和“中國AI的頭號玩家”。
“很多人都在關(guān)注GPT-5的發(fā)布時間,但我更感興趣的是,哪些應(yīng)用可以充分利用大語言模型的所有能力?!崩顝┖暝谂c陽獅集團監(jiān)事會主席莫里斯?列維(Maurice Levy)對談時表示,中國AI與西方的最大區(qū)別在于應(yīng)用,中國有數(shù)百個基礎(chǔ)模型,但人們越來越多地在討論什么是AI時代的超級應(yīng)用。他介紹說,應(yīng)用驅(qū)動了中國AI的快速發(fā)展。
在李彥宏看來,關(guān)注應(yīng)用并非是忽視基礎(chǔ)模型的發(fā)展,與之相反,AI應(yīng)用與基礎(chǔ)大模型的發(fā)展相輔相成。應(yīng)用的進(jìn)步,可以推動基礎(chǔ)模型的創(chuàng)新,也有助于加快從互聯(lián)網(wǎng)時代向人工智能時代的轉(zhuǎn)變。
“我是人工智能的長期信仰者。所以在十多年前,我們就開始積極投入研發(fā)人工智能,尤其是與自然語言相關(guān)的人工智能?!崩顝┖瓯硎?。
01
中國AI的頭號玩家
一直以來,李彥宏信仰技術(shù),他曾在公開發(fā)言中表示,“技術(shù)是我們的信仰,百度走到今天,是因為我們信仰技術(shù),我們覺得技術(shù)可以改變世界?!痹缭?0年前,李彥宏在北大讀書期間就對AI抱有濃厚的興趣。李彥宏創(chuàng)立百度后,在確立了中文搜索引擎的絕對優(yōu)勢后,他意識到AI是解決搜索引擎問題的核心技術(shù),因為兩者的本質(zhì),都是讓機器理解人類語言?!八栽谑嗄昵埃覀兙烷_始積極投入研發(fā)人工智能,尤其是與自然語言相關(guān)的人工智能。”
2023年,《時代》周刊發(fā)布了首屆全球百大AI人物,李彥宏與特斯拉CEO埃隆·馬斯克、英偉達(dá)創(chuàng)始人兼CEO黃仁勛、Open AI CEO薩姆·奧特曼等人被評為全球AI領(lǐng)袖,是該榜單中唯一入選的中國企業(yè)家?!稌r代》周刊在介紹李彥宏時表示,“李彥宏是中國最杰出的未來主義者,長期投身于AI發(fā)展的浪潮?!保ˋs China’s foremost futurist, Robin Li has been riding the AI wave for a long time.)
李彥宏對AI抱有極大的熱情。在2024年的一次內(nèi)部講話中,李彥宏表示,“大模型我們走在最前面,我們要去勇闖無人區(qū),需要去冒前人沒有冒過的風(fēng)險。”……“十個創(chuàng)新,可能九個最后都是以失敗告終的,但我們不會放棄,我們會去做第11個、第12個……我相信終有一天,我們會向世界證明,技術(shù)是有價值的?!?/p>
經(jīng)過十多年的布局,百度在AI研發(fā)方面投入近1700億元,創(chuàng)造了一系列突出的技術(shù)成果,持續(xù)引領(lǐng)中國AI浪潮。李彥宏介紹說,百度于2019年推出1億參數(shù)規(guī)模的文心大模型1.0版本,在2.0版本升級至10億參數(shù),ChatGPT發(fā)布后不久,即推出了3.0版本,發(fā)布速度遠(yuǎn)超全球其他上市公司,“是因為我們準(zhǔn)備得更加充足、工程師非常努力,我們一直在朝著這個方向努力?!?/p>
在AI原生應(yīng)用方面,百度在全球科技大廠中首個推出中文大語言模型應(yīng)用——文心一言。文心一言開放首日即回答了用戶3342萬個問題。開放后12小時,文心一言迅速登上Apple Store免費應(yīng)用排行榜首位,成為首個登頂應(yīng)用商店榜首的中文AI原生應(yīng)用。
在文心一言的幫助下,廣大用戶“解放了生產(chǎn)力”。某昵稱為“1952的野生”知乎博主表示,文心一言激發(fā)了他的創(chuàng)作想法,可以快速潤色內(nèi)容?!拔矣X得文心一言對我的幫助主要體現(xiàn)在兩個方面,一個方面是解放,另外一個方面是自信?!?/p>
文心一言也創(chuàng)造了新的“工作崗位”。一位18歲的實習(xí)提示詞工程師Mio,在短短兩個月內(nèi)瘋狂寫提示詞,成功上線了100多個,順利成為AI行業(yè)的從業(yè)者之一。他認(rèn)為,“文心一言可以說是直接改變了我的生活方式。原來我只是一個愛好者,靠著文心一言我現(xiàn)在竟然成為了一個從業(yè)者,這是我一年前不敢想的?!?/p>
近期,新東方英語名師、孟羽童等知名人物也先后入駐文心一言APP。根據(jù)李彥宏在2024百度AI開發(fā)者大會上披露的數(shù)據(jù),發(fā)布一年多以來,文心一言用戶已經(jīng)突破2億。與2023年12月相比,其用戶規(guī)模足足翻了一倍。
百度還在2013年就已經(jīng)開始布局自動駕駛。李彥宏在2024百度AI開發(fā)者大會上透露,“視覺大模型最大的應(yīng)用場景是自動駕駛。百度在這個方向上是最好的,是自動駕駛的全球領(lǐng)導(dǎo)者,我們不只訓(xùn)練AI如何生成視頻,更訓(xùn)練AI理解真實世界發(fā)生的事情并預(yù)測未來?!?/p>
2017年,百度對外開放了國內(nèi)第一個自動駕駛平臺Apollo(阿波羅)。根據(jù)全球領(lǐng)先的法律和商業(yè)分析商“律商聯(lián)訊LexisNexis”最新發(fā)布的《駛向未來:自動駕駛創(chuàng)新洞察》(Driving Toward Tomorrow:A Deep Dive Into Autonomous Vehicle Innovation)報告,百度自動駕駛在專利資產(chǎn)指數(shù)、專利包規(guī)模等多項排名上位列全球榜首,展現(xiàn)了創(chuàng)新技術(shù)與商業(yè)化的成功結(jié)合。
公開資料顯示,百度Apollo L4級自動駕駛安全運營測試?yán)锍汤塾嬕殉?億公里,自動駕駛牌照數(shù)量超過1000張,已經(jīng)成為智能化汽車時代的“賣水人”。
此外,百度還力圖成為AI領(lǐng)域的“黃埔軍?!?。2020年6月,百度宣布未來5年預(yù)計培養(yǎng)AI人才500萬,到2024年4月,百度宣布該計劃已經(jīng)提前完成。但百度還在持續(xù)發(fā)力AI人才培養(yǎng),2023百度世界大會上,百度又公布了人才培養(yǎng)星河計劃,將為社會再培養(yǎng)500萬大模型人才。
一直以來,百度都在不斷提升大模型的效率和效果,降低大模型的成本和門檻,讓更多人享受到AI的時代紅利。2024年5月21日,百度甚至宣布將ERNIE Speed、ERNIE Lite兩款大模型免費。
由于其在AI領(lǐng)域的突出貢獻(xiàn),2023年11月21日《財富》發(fā)布的首屆全球“《財富》人工智能創(chuàng)新者50強榜單”(Fortune 50 AI Innovators)中,百度成為唯一入選該榜單的中國企業(yè),同時入選50強的還有微軟、谷歌、OpenAI等全球知名科技企業(yè)。
《財富》在對百度的評語中指出,百度文心大模型4.0在成熟度和功能上與OpenAI的ChatGPT不相上下,并在多項中文特定任務(wù)中超越了ChatGPT。
經(jīng)過十年的磨礪,百度AI逐漸展露鋒芒。正如李彥宏所說,“人們總是高估技術(shù)的短期價值,低估技術(shù)的長期價值,”……“堅定的信仰和持久的堅持,讓我們實現(xiàn)顛覆性創(chuàng)新”。他還表示,“2023年已經(jīng)看到了通向通用人工智能的曙光,2024年我們熬過去,就能夠化繭成蝶。”
02
AI應(yīng)用驅(qū)動基礎(chǔ)模型創(chuàng)新
AI大模型能夠理解人類的自然語言表達(dá),并通過龐大的網(wǎng)絡(luò)結(jié)構(gòu)實現(xiàn)具有針對性的內(nèi)容輸出。從效果上看,生成式AI表現(xiàn)為“無所不知、無所不能”,其具備了邏輯推理、上下文理解、文字創(chuàng)作、知識提取、代碼生成等非常多元化的強大能力,但這取決于大模型的訓(xùn)練程度。
一位業(yè)內(nèi)人士表示,“通過中文或英文數(shù)據(jù)訓(xùn)練出來的大模型,差異還是比較大的,中文的上下文理解和語義的多解性要大于英文?!币蚨?,以中文“投喂”大模型的中國科技大廠在這個方面具有天然優(yōu)勢。
在目前全球各類大模型評測榜單中,國內(nèi)大模型均在TOP10中長期占據(jù)半數(shù)席位,其中百度文心大模型、阿里通義千問、智譜GLM-4等更是穩(wěn)居TOP5,在理解、邏輯、記憶等整體能力上保持在世界一流水平,更在中文理解與創(chuàng)作上具有顯著優(yōu)勢。
值得一提的是,得益于百度四層技術(shù)棧的獨特優(yōu)勢,芯片、框架、大模型和終端應(yīng)用場景能夠形成高效的反饋閉環(huán),能夠幫助大模型不斷調(diào)優(yōu)迭代。相比一年前,文心大模型的算法訓(xùn)練效率提升到了原來的5.1倍,周均訓(xùn)練有效率達(dá)到98.8%,推理性能提升了105倍,推理的成本降到了原來的1%。
根據(jù)2024年3月國內(nèi)人工智能權(quán)威機構(gòu)清華大學(xué)基礎(chǔ)模型研究中心發(fā)布《SuperBench大模型綜合能力評測報告》,在人類對齊能力評測中的中文推理和中文語言,以及語義理解中的數(shù)學(xué)能力和閱讀理解能力等方面,文心大模型具有明顯優(yōu)勢。李彥宏在大會上也表示,“現(xiàn)在文心大模型4.0比中文的GPT 4更好,因為我們使用了更多的中文數(shù)據(jù)來訓(xùn)練模型?!?/p>
此外,中國有著豐富的AI應(yīng)用場景。正如李彥宏在大會上所說,“中國AI與西方的最大區(qū)別在于應(yīng)用,中國有數(shù)百個基礎(chǔ)模型,但人們越來越多地在討論什么是AI時代的超級應(yīng)用?!彼в羞@樣一種觀點——技術(shù)的進(jìn)步或改進(jìn)是由應(yīng)用場景驅(qū)動的?!皯?yīng)用領(lǐng)域的進(jìn)步可以推動基礎(chǔ)模型的創(chuàng)新,也有助于加速從互聯(lián)網(wǎng)時代到人工智能時代的轉(zhuǎn)變?!?/p>
在李彥宏看來,沒有構(gòu)建于基礎(chǔ)模型之上的、豐富的AI原生應(yīng)用生態(tài),大模型一文不值?!叭绻f大模型是‘樹根’,那么大量優(yōu)質(zhì)的應(yīng)用則是大模型壯碩‘樹根’所結(jié)出的累累碩果?!?/p>
過去幾年,中國依靠多樣化的應(yīng)用場景以及超大規(guī)模市場優(yōu)勢,在社交、移動支付、搜索、電商、外賣、快遞等領(lǐng)域孵化一批領(lǐng)先的優(yōu)質(zhì)應(yīng)用,并在產(chǎn)業(yè)化的縱深和廣度上日益精進(jìn)。隨著AI大模型的接入,將會為產(chǎn)業(yè)變革帶來更大圖景和潛在價值。
李彥宏對此深信不移,他在2024年百度Q1業(yè)績電話會上表示,“隨著生成式人工智能時代在中國的到來,文心大模型等基礎(chǔ)模型將成為基礎(chǔ)設(shè)施,融入人們生活的方方面面。我們正在讓文心大模型系列變得更加實惠和高效。這將為百度帶來更多機遇。”
百度正在“積極推進(jìn)用文心大模型重構(gòu)To C和To B業(yè)務(wù),利用生成式AI增強用戶體驗、提升客戶效率、提供智能體和應(yīng)用開發(fā)工具、并帶來更高效的系列模型。”
To C業(yè)務(wù)方面,百度已經(jīng)與三星、榮耀、小米、OPPO、vivo等手機廠商達(dá)成合作。比如在三星全新推出的Galaxy S24手機中,深度集成了百度文心大模型的多項能力,不僅可提供端側(cè)賦能的通話、翻譯功能,還給用戶帶來全新的智能摘要、排版等生成AI體驗,首創(chuàng)的“即圈即搜”功能更令人驚艷。
而“文心大模型”與榮耀平臺級端側(cè)AI大模型“魔法大模型”相結(jié)合則滿足了用戶的更多個性化需求。比如,當(dāng)用戶要求“幫我制定健康計劃”時,魔法大模型會分析用戶健康信息,自動生成具象化提示詞,再調(diào)度文心大模型,生成更全面的個人定制健身計劃。
如今,文心大模型的合作領(lǐng)域還從手機向PC和電動汽車領(lǐng)域拓展,合作對象包括聯(lián)想、蔚來汽車等頭部品牌。李彥宏表示,向智能設(shè)備的拓展,為文心大模型被更大規(guī)模用戶采用提供了充足機會。
B端,百度充分發(fā)揮技術(shù)優(yōu)勢,全面升級百度智能云千帆大模型平臺,發(fā)布系列新模型及開發(fā)工具組件,滿足企業(yè)在大模型產(chǎn)業(yè)場景落地中的多樣化需求,并已經(jīng)成功應(yīng)用在金融、能源、教育等多個產(chǎn)業(yè)中。
比如在礦山產(chǎn)業(yè),百度智能云攜手山源科技,基于文心大模型,依托百度智能云千帆大模型平臺能力共同打造了礦山行業(yè)智能應(yīng)用“電博士及數(shù)字調(diào)度員”,通過注入供電專業(yè)相關(guān)知識、經(jīng)驗、規(guī)則、規(guī)范等,讓大模型具備煤礦供電的專業(yè)知識和技能,定位于煤礦供電專業(yè)的資深貼身助手,實現(xiàn)陪伴式輔助運維。
AI大模型是一個重資源稟賦、高進(jìn)入門檻的賽道,除了對算法模型的有效性、高質(zhì)量的數(shù)據(jù)、算力的支撐能力均有極高要求外,模型的優(yōu)化迭代亦有賴于資金和人才的持續(xù)投入,而大模型的實際落地和應(yīng)用場景也是其能否持續(xù)升級的重要因素。
李彥宏堅信:“在未來五年,或者十年,每個國家都有機會發(fā)展自己的AI大模型。我確信生成式人工智能具有真正變個性的力量,它最終會像人類一樣聰明,而且進(jìn)步得很快。當(dāng)我們朝著這個方向努力的時候,每個人的生活都會得到改善。”