中共中央宣傳部委托新華通訊社主辦

百度沈抖:模型精調指數(shù)級增長,大模型進入深度應用期

2024-11-13 21:08
來源:新華網(wǎng)

11月12日,以“應用來了"為主題的百度世界2024在上海召開。會上,百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖分享了百度智能云在大模型產(chǎn)業(yè)落地方面的最新進展,并在企業(yè)級AI原生應用開發(fā)、大模型開發(fā)調優(yōu)等方面發(fā)布一系列全新功能。

目前,百度智能云擁有中國最大的大模型產(chǎn)業(yè)落地規(guī)模。超過六成的央企和大量的民營企業(yè),正在聯(lián)合百度智能云進行AI創(chuàng)新。百度智能云千帆大模型平臺已經(jīng)幫助客戶精調了3.3萬個模型、開發(fā)了77萬個企業(yè)應用、文心大模型日均調用量超過15億次。

沈抖表示,AI應用正率先在B端爆發(fā)。由企業(yè)級大模型工程平臺、異構算力平臺組成的新型AI基礎設施,將替代傳統(tǒng)云計算,為大模型應用在企業(yè)生產(chǎn)力場景中的規(guī)模落地提供關鍵支撐。

百度集團執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖

AI應用率先在B端爆發(fā)

60%央企使用百度云AI服務

2024年,大模型產(chǎn)業(yè)落地顯著提速,在行業(yè)場景覆蓋廣度、落地深度等方面都有顯著提升。目前,百度智能云已經(jīng)在能源、電力、制造、金融、交通、政務、互聯(lián)網(wǎng)、教育、電商等數(shù)十個行業(yè)、幾百個場景中落地大模型應用。

在能源電力行業(yè),國家電網(wǎng)正在圍繞文心大模型、千帆平臺,結合電力行業(yè)高質量數(shù)據(jù),聯(lián)合百度共創(chuàng)電力行業(yè)大模型基礎底座,并在調度、設備、營銷等六大專業(yè)領域深入探索。目前,已經(jīng)在電力設備運檢、供電服務等電力行業(yè)核心場景成功完成應用落地。

在餐飲行業(yè),中國最大的餐飲公司百勝中國,基于文心大模型打造了AI智能客服系統(tǒng),為旗下包括肯德基在內的多個品牌提供服務。百勝中國CTO張雷表示,目前,AI客服每天能夠為百勝中國處理超過15萬次消費者溝通,問題解決率高達90%;在輔助人工方面,AI客服能夠快速歸納、總結消費者訴求,輔助客服更快速、更精準地回復,整體效率提高10%!此外,大模型還能夠實時評估客服服務質量,幫助百勝中國進一步提升服務水平。

百勝中國CTO張雷

目前,已有超過六成的央企和大量的民營企業(yè),正在聯(lián)合百度智能云進行AI創(chuàng)新,文心大模型日均調用量超過15億次。

沈抖認為,AI應用正率先在B端爆發(fā),而“企業(yè)級”AI應用大量涌現(xiàn)的背后,是產(chǎn)品服務形態(tài)的突破性變革與能力的大幅拉升。

以百度智能云“曦靈”數(shù)字人平臺為例,全新升級的“文生3D數(shù)字人視頻”功能,能夠大幅提升電商、教育、文旅等行業(yè)的內容創(chuàng)作、營銷推廣效率,大幅降低成本支出。

沈抖表示,無數(shù)的AI應用,正在重新定義人與數(shù)字世界、物理世界之間的交互方式?,F(xiàn)在,這些應用已經(jīng)深入到企業(yè)“研產(chǎn)供銷服”的各個環(huán)節(jié),并成為企業(yè)提升競爭力的關鍵要素。

模型精調需求大增

千帆平臺發(fā)布工作流Agent、模型蒸餾兩大開發(fā)功能

傳統(tǒng)的企業(yè)業(yè)務中,復雜的工作和任務往往過度依賴專家經(jīng)驗和固有流程,即工作流;即便在數(shù)字化系統(tǒng)中,傳統(tǒng)工作流配置依舊是沒有“大腦”的機械執(zhí)行,難有實質性的突破。

大模型具備強大的意圖理解和泛化能力,能夠充分理解工作流的目的與內涵,相當于一顆會思考的“大腦”;通過與企業(yè)工作流相結合,又可以有效解決大模型“幻覺”問題,增強大模型“控場能力”,保障復雜任務的決策與執(zhí)行準確。二者結合,構成了智能時代企業(yè)真正需要的“數(shù)字員工”。

本次大會,百度智能云千帆大模型平臺正式發(fā)布“工作流Agent”功能,旨在幫助企業(yè)快速開發(fā)出面向復雜對話場景的AI應用,快速擁有專業(yè)水平的“數(shù)字員工”。通過學習各種企業(yè)流程與規(guī)范,工作流Agent能夠適應不同崗位職責,快速規(guī)?;瘡椭疲蠓嵘髽I(yè)運轉效率。

在醫(yī)療行業(yè),杭州全診醫(yī)學基于千帆平臺和文心大模型打造了AI醫(yī)療助理應用,能夠在導診、預診、診間、入院、手術、隨訪等全階段服務醫(yī)生患者。以輔助醫(yī)生撰寫病歷為例,全診醫(yī)學通過使用20萬份精標病歷數(shù)據(jù)對大模型進行精調,使AI醫(yī)療助理的醫(yī)學用語更準確、更規(guī)范,大幅提升病歷內容質量。病歷生成的準確度提升了45%,病歷書寫時間減少75%,醫(yī)生的接診量提高了20%,造福更多病患。

而針對數(shù)據(jù)積累不足,難以承擔人工精標數(shù)據(jù)成本的企業(yè),千帆平臺全新推出模型蒸餾解決方案,幫助企業(yè)利用文心旗艦級大模型生成專業(yè)數(shù)據(jù),完成全流程的數(shù)據(jù)準備工作,加速啟動模型精調工作。

以百度電商數(shù)字人直播平臺“慧播星”為例,通過使用文心旗艦模型ERNIE 4.0 Turbo萃取訓練數(shù)據(jù),生成模型精調數(shù)據(jù)集,對輕量級大模型ERNIE Lite進行精調,精調后的模型在特定場景中的效果與旗艦模型基本持平,并擁有更快的推理速度,成本大幅下降90%。模型上線以后,數(shù)字人直播間的互動率大幅提升11%,帶貨轉化率也實現(xiàn)了極大提升。

大算力管理依然是最大難題

百舸4.0升級十萬卡集群跨地域部署能力

大算力是大模型落地的基礎條件。為了滿足企業(yè)落地大模型從集群創(chuàng)建、開發(fā)實驗,到模型訓練、模型推理的全旅程算力需求,百度智能云推出百舸AI異構計算平臺 4.0,服務了中國石化、中海石油、長安汽車、上海交通大學、地平線等行業(yè)龍頭企業(yè)和機構,目前已具備了成熟的10萬卡集群部署和管理能力。

沈抖表示,為了支撐大模型的進一步高速發(fā)展,百度智能云提前布局,是行業(yè)內最早打磨10萬卡集群能力的廠商之一,并通過技術創(chuàng)新解決了集群算力供給、跨地域部署兩大核心難題。

首先,在算力供給方面,百舸平臺兼容國內外主流AI芯片,支持同一智算集群中混合使用同一廠商不同代際芯片、不同廠商芯片,最大程度上屏蔽硬件之間差異,幫助中國企業(yè)擺脫單一芯片帶來的高溢價和供應鏈風險。

目前,在萬卡規(guī)模集群上,百舸能夠將兩種芯片混合訓練大模型的效率折損控制在5%以內。未來,“一云多芯”將成為中國企業(yè)的必然選擇。

另一方面,10萬卡規(guī)模超大集群需要占據(jù)大概10萬平方米空間,相當于13個標準足球場;每天則要消耗大約300萬千瓦時的電力,相當于北京市東城區(qū)一天的居民用電量。這種對于空間和能源的巨大需求,遠超傳統(tǒng)機房部署的承載能力,而跨地域機房部署又會給網(wǎng)絡通信帶來巨大挑戰(zhàn)。

通過設計高效的網(wǎng)絡拓撲結構,結合模型切分優(yōu)化和跨地域無擁塞高性能網(wǎng)絡方案,百舸能夠在橫跨幾十公里的多機房組成的萬卡規(guī)模的集群上,將單一模型訓練任務的性能折損控制在4%以內,達到業(yè)界領先水平。

責任編輯:孔德明

熱門推薦