百度技術(shù)委員會(huì)主席吳華
吳華介紹,大模型的學(xué)習(xí)方式與人類相似,有“先天學(xué)習(xí)”機(jī)制,也要“后天學(xué)習(xí)”。首先要構(gòu)建“先天”學(xué)習(xí)機(jī)制,如神經(jīng)網(wǎng)絡(luò)并行算法,形成類似人類“語(yǔ)言大腦皮層”機(jī)制,通過文本自監(jiān)督預(yù)訓(xùn)練,將公開通用知識(shí)和專有行業(yè)知識(shí)學(xué)習(xí)到模型中。在此基礎(chǔ)上,通過“后天學(xué)習(xí)”從環(huán)境中獲得反饋,逐步提升理解、生成、推理、記憶等能力。這種方式使大模型具備通用能力。
隨著技術(shù)的進(jìn)步,為什么說大模型引領(lǐng)了人工智能的發(fā)展?吳華表示,大模型具有效果好、泛化性強(qiáng)、研發(fā)流程標(biāo)準(zhǔn)化程度高等特點(diǎn)。在技術(shù)通用性方面,大模型在不同任務(wù)、語(yǔ)言、模態(tài)、場(chǎng)景的通用性都變得越來越好。這些都進(jìn)一步引領(lǐng)了人工智能向前發(fā)展。
以文心大模型為例,百度文心知識(shí)增強(qiáng)大模型從萬(wàn)億數(shù)據(jù)和千億知識(shí)中融合學(xué)習(xí),提出了知識(shí)內(nèi)化與知識(shí)外用技術(shù),模型效果和效率顯著提升。突破了基于思考模型的智能體技術(shù),包括理解、規(guī)劃、反思和進(jìn)化,能夠通過慢思考的方式調(diào)用工具完成復(fù)雜任務(wù),在與環(huán)境的互動(dòng)中自我進(jìn)化。吳華也在現(xiàn)場(chǎng)解讀了智能體的思考過程,演示了智能體如何經(jīng)過思考調(diào)用工具。
公開資料顯示,百度在2019年3月發(fā)布了文心大模型1.0,現(xiàn)已經(jīng)升級(jí)到文心大模型4.0 Turbo版。截至目前,文心一言用戶規(guī)模已破3億,文心大模型日均調(diào)用次數(shù)超7億,日均處理文本Tokens超1萬(wàn)億。
當(dāng)前,大模型技術(shù)正在為各行各業(yè)注入新動(dòng)能。吳華也從人類經(jīng)歷的技術(shù)革命為示例闡述,人類經(jīng)歷的三次工業(yè)革命分別以機(jī)械技術(shù)、電氣技術(shù)和信息技術(shù)為核心驅(qū)動(dòng)力。驅(qū)動(dòng)工業(yè)革命的核心技術(shù)表現(xiàn)出很強(qiáng)的通用性,呈現(xiàn)出標(biāo)準(zhǔn)化、自動(dòng)化、模塊化的工業(yè)大生產(chǎn)特征。如今,第四次工業(yè)革命正在發(fā)生,人工智能技術(shù)趨向標(biāo)準(zhǔn)化、自動(dòng)化和模塊化,進(jìn)入工業(yè)大生產(chǎn)階段,賦能農(nóng)業(yè)、制造、能源、交通、金融、教育、醫(yī)療、媒體等千行百業(yè)轉(zhuǎn)型升級(jí)。
例如,智能交通方面,基于文心大模型,事件檢測(cè)準(zhǔn)確率超95%,應(yīng)急處置效率和信息發(fā)布效率提升90%,幫助京雄高速運(yùn)營(yíng)管理實(shí)現(xiàn)跨越式變革;智能創(chuàng)作方面,文心大模型支持百度文庫(kù)100多項(xiàng)多模態(tài)AI能力,累計(jì)使用次數(shù)突破22億;智慧財(cái)務(wù)方面,跨多平臺(tái)繁瑣操作整合為報(bào)銷智能體自動(dòng)實(shí)現(xiàn),報(bào)銷操作秒級(jí)完成,報(bào)銷效率提升83%,提供7 x 24h智能服務(wù)。
此外,人工智能帶來科學(xué)研究范式變革,為科研創(chuàng)新帶來更多可能。例如,在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)中,通過深度學(xué)習(xí)算法能夠快速準(zhǔn)確地推測(cè)蛋白質(zhì)的三維結(jié)構(gòu),加速了藥物研發(fā)和生物學(xué)研究的進(jìn)程。
吳華最后表示,大模型技術(shù)正在為各行業(yè)注入新動(dòng)能,大模型潛力正在不斷釋放,賦能新質(zhì)生產(chǎn)力,為經(jīng)濟(jì)與社會(huì)發(fā)展貢獻(xiàn)力量。