2024年7月6日上午,2024世界人工智能大會語料主題論壇在上海市世博中心成功召開。上海市各相關(guān)部門代表、上海人工智能實驗室、人民網(wǎng)、上海報業(yè)、上海圖書館、上海信投、上海算法創(chuàng)新研究院、中國信通院、復(fù)旦大學(xué)、華東師范大學(xué),以及廣州視睿電子科技有限公司(希沃)等近1000家大模型語料生態(tài)企業(yè)參會。
高質(zhì)量語料庫是人工智能賦能新質(zhì)生產(chǎn)力的關(guān)鍵。大模型賦能千行百業(yè),需要構(gòu)建與場景適配的語料體系,需要規(guī)則與實踐的“并跑”。會上,《教育人工智能大模型數(shù)據(jù)治理與共享技術(shù)標準白皮書》正式發(fā)布,旨在推動加強教育人工智能大模型數(shù)據(jù)治理與共享,通過科學(xué)的策略,最大化挖掘教育數(shù)據(jù)價值,助力教育的創(chuàng)新。
《教育人工智能大模型數(shù)據(jù)治理與共享技術(shù)標準白皮書》由教育部教育信息化技術(shù)標準委員會暨全國信息技術(shù)標準化技術(shù)委員會教育技術(shù)分技術(shù)委員會指導(dǎo),由華東師范大學(xué)牽頭,聯(lián)合上海交通大學(xué)、北京郵電大學(xué)、國家開放大學(xué)以及庫帕思,以及廣州視睿(希沃)等頭部企業(yè)共同編制。
本白皮書重點分析了教育AI大模型數(shù)據(jù)治理與共享技術(shù)的重要性及當(dāng)前面臨的挑戰(zhàn)。同時,白皮書梳理了國內(nèi)外教育AI大模型發(fā)展情況及教育數(shù)據(jù)治理與共享的政策、標準和相關(guān)機構(gòu),并詳細介紹了教育AI大模型的系列標準,包括已發(fā)布標準和在研標準。
本白皮書提出,“建設(shè)一套合規(guī)有效、高質(zhì)量的數(shù)據(jù)治理與共享技術(shù)標準,供教育機構(gòu)和技術(shù)開發(fā)者參考借鑒?!?/p>
白皮書內(nèi)容建議,“構(gòu)建教育AI大模型數(shù)據(jù)治理與共享體系的整體架構(gòu)、建設(shè)數(shù)據(jù)治理與共享聯(lián)盟、完善標準體系,同時需要考慮應(yīng)對數(shù)據(jù)安全與倫理問題等。”
白皮書還展開介紹了相關(guān)的案例應(yīng)用,涵蓋區(qū)域、學(xué)校、企業(yè)層面。以上海市寶山區(qū)為例,寶山區(qū)通過搭建開放共享、技術(shù)集成、交互可視的技術(shù)架構(gòu),統(tǒng)籌建設(shè)區(qū)域教育管理及教學(xué)基礎(chǔ)應(yīng)用服務(wù)平臺,打造一個惠及區(qū)域內(nèi)所有學(xué)校的數(shù)字基座。
白皮書倡導(dǎo),“應(yīng)促進可控、可信、安全、綠色、好用、高效的教育通用人工智能大模型構(gòu)建,實現(xiàn)有教育溫度、育人為本的人工智能及智能教育環(huán)境建設(shè),探索數(shù)字教育新范式,實現(xiàn)教育的高質(zhì)量發(fā)展。 ”
此外,論壇還宣布“語料運營平臺1.0”上線,同時集中發(fā)布首批十大高質(zhì)量語料產(chǎn)品。此外,會上50余家單位共同發(fā)起“語料生態(tài)服務(wù)大模型可持續(xù)發(fā)展倡議”,共同倡導(dǎo)攜手為我國大模型產(chǎn)業(yè)發(fā)展持續(xù)提供高質(zhì)量語料。