11月12日,以“應(yīng)用來了”為主題的百度世界2024在上海舉辦,百度首席技術(shù)官王海峰在會上宣布了這一數(shù)據(jù)。除用戶規(guī)模外,王海峰還解讀了文心大模型最新技術(shù)及應(yīng)用,如檢索增強(qiáng)的文生圖、無代碼產(chǎn)品秒噠、文心快碼等。
大會現(xiàn)場,繼百度創(chuàng)始人李彥宏宣布文心大模型日均調(diào)用量已超過15億,王海峰公布了文心一言用戶規(guī)模達(dá)到4.3億。
自去年3月16日發(fā)布文心一言以來,百度文心大模型不斷升級,知識增強(qiáng)、檢索增強(qiáng)以及智能體等技術(shù)也在不斷進(jìn)化。
據(jù)王海峰介紹,在檢索增強(qiáng)方面,百度研發(fā)了「理解-檢索-生成」協(xié)同優(yōu)化的檢索增強(qiáng)技術(shù),提升了大模型技術(shù)及應(yīng)用效果;面向不同應(yīng)用場景的生圖需求,進(jìn)一步研發(fā)了檢索增強(qiáng)的文生圖技術(shù),既可以生成精確的圖片,也可以進(jìn)行泛化生圖。
那么,大模型是如何做到這一點的呢?
首先,基于大模型對用戶的需求進(jìn)行分析理解,自動規(guī)劃精確或泛化方案,比如對哪些實體進(jìn)行增強(qiáng);接著在增強(qiáng)階段,對需要增強(qiáng)的實體,檢索并選擇相應(yīng)的參考圖。最后在生成階段,自研了多??煽厣鷪D大模型,一方面,通過局部注意力計算,在保持實體特征不變的情況下,實現(xiàn)了圖像的高泛化生成,比如根據(jù)牛頓的肖像,生成繪本風(fēng)格的牛頓;另一方面,通過整體注意力計算,進(jìn)行高精確的圖像生成,比如生成圖中的汽車跟原圖片保持完全一致。在實際應(yīng)用中,這個方法也支持用戶上傳參考圖,應(yīng)用戶期望進(jìn)行生成。
早在去年10月,百度就發(fā)布了智能體機(jī)制,并研制了系統(tǒng)2。其核心是思考模型,包括理解、規(guī)劃、反思和進(jìn)化,能夠做到可靠執(zhí)行,自我進(jìn)化,并在一定程度上將思考過程白盒化,從而讓機(jī)器像人一樣思考和行動,自主完成復(fù)雜任務(wù),同時在環(huán)境中持續(xù)學(xué)習(xí)、自主進(jìn)化。
人類社會中,一個人掌握的知識和技能終歸是有限的。為了完成更加復(fù)雜的任務(wù)或項目,需要團(tuán)隊協(xié)作。同樣,智能體為了完成復(fù)雜任務(wù),也需要多智能體的協(xié)作,比如,中心化、去中心化和流水線等模式。多智能體的協(xié)作可以有效增強(qiáng)智能系統(tǒng)的整體效能,提升解決復(fù)雜問題的能力。
王海峰分享了多智能體在代碼場景里的應(yīng)用——秒噠和文心快碼。秒噠采用了智能體的中心化模式,其中的代碼智能體通過場景知識的增強(qiáng),提升了復(fù)雜代碼生成的質(zhì)量與穩(wěn)定性,高效實現(xiàn)用戶需要的功能。智能代碼助手文心快碼升級至3.0版本,現(xiàn)場王海峰進(jìn)一步演示了文心快碼完成系統(tǒng)的功能開發(fā)、代碼測試和問題修復(fù)等能力。在開發(fā)全流程中,多個智能體流水線協(xié)同,大幅提升了程序員的工作質(zhì)量和效率。
大模型、智能體等技術(shù)發(fā)展迅速,而這些技術(shù)如何更高效率、更低門檻應(yīng)用于產(chǎn)業(yè)呢?
據(jù)了解,面向產(chǎn)業(yè)需求,百度打造了文心大模型矩陣,包括ERNIE 4.0 Turbo等旗艦大模型、ERNIE Speed等輕量模型,以及基于基礎(chǔ)模型生產(chǎn)的系列思考模型和場景模型,滿足不同應(yīng)用的需要。而在這背后,文心大模型和飛槳深度學(xué)習(xí)平臺聯(lián)合優(yōu)化,持續(xù)創(chuàng)新,提升了模型效果、訓(xùn)練效率和推理性能,支撐了文心大模型的廣泛應(yīng)用。王海峰現(xiàn)場披露,飛槳文心開發(fā)者數(shù)量已達(dá)1808萬,服務(wù)了43萬家企業(yè),創(chuàng)建了101萬個模型。
隨著人工智能技術(shù)加速進(jìn)步,AI在千行百業(yè)的應(yīng)用也越來越深入。例如,在教育科普領(lǐng)域,中國科學(xué)技術(shù)館與百度達(dá)成戰(zhàn)略合作,雙方將利用人工智能技術(shù)為科普教育注入新活力,賦能智慧科技場館建設(shè)。中國科學(xué)技術(shù)館館長郭哲與王海峰還在現(xiàn)場發(fā)布了“科技館智能體”,助力科普服務(wù)觸手可及;在體育領(lǐng)域,大模型等人工智能技術(shù)輔助國家隊備戰(zhàn)訓(xùn)練,為運動員奪金爭銀提供科技支撐。智能跳水輔助訓(xùn)練系統(tǒng)采用云、邊、端一體化技術(shù),全自動識別、跟蹤、采集、分析每一個跳水動作。基于文心大模型,系統(tǒng)還可以對動作實時打分、精準(zhǔn)量化分析,制定訓(xùn)練計劃,對運動員身體數(shù)據(jù)進(jìn)行科學(xué)評估和全面管理。
當(dāng)下科學(xué)技術(shù)的發(fā)展和廣泛應(yīng)用,離不開人才。科技是第一生產(chǎn)力,人才是第一資源?,F(xiàn)場,百度公布了人工智能人才培養(yǎng)的最新數(shù)據(jù):已為社會培養(yǎng)了592萬AI人才。
最后,王海峰還篤定地透露,文心大模型仍在持續(xù)訓(xùn)練中,更強(qiáng)大的新版本值得期待。