中共中央宣傳部委托新華通訊社主辦

好未來斬獲國際人工智能頂級會議競賽雙料冠軍

2021-04-14 15:19
來源:新華財經(jīng)

近日,好未來斬獲INTERSPEECH 2021“非母語兒童識別”(The INTERSPEECH 2021 shared task on Automatic Speech Recognition for non-native children’s speech)雙料冠軍。INTERSPEECH作為由國際語音通信協(xié)會ISCA組織的語音研究領(lǐng)域的頂級會議,是全球最大的綜合性語音信號處理領(lǐng)域的科技盛會之一。本次競賽吸引了行業(yè)內(nèi)諸多國際知名高校及企業(yè)的參與,好未來最終以詞錯率顯著低于第二名強勢奪冠。

圖:INTERSPEECH是國際語音頂級會議之一

登頂國際競賽,領(lǐng)跑AI+教育新征程

本次競賽的賽題是解決非母語兒童語音識別問題。由于兒童語音天生的差異性,包含生理差異(如兒童聲道長度較短)、認知差異(如語言習得水平較低,常出現(xiàn)語法邏輯錯誤、發(fā)音前置錯誤、發(fā)音不完整和語種混雜等情況),以及行為差異(如兒童習慣低聲私語)等,導致通用語音識別模型難以適配,這就讓非母語兒童語音識別系統(tǒng)的構(gòu)建更具挑戰(zhàn)性。另一方面則是非母語兒童語音的數(shù)據(jù)資源較為稀缺,使得常規(guī)聲學建模方法在該場景下很難奏效。

針對上述挑戰(zhàn),好未來AI語音團隊憑借在實際教育場景中積累的豐富經(jīng)驗,充分結(jié)合兒童語音在生理特征及語言認知方面的特殊性,嘗試了不同的解決方法。比如在數(shù)據(jù)及特征層面,采用對不同學齡階段的兒童進行歸一化、非語言符號共享、非流利語料生成、分級語言模型構(gòu)建、半監(jiān)督語音活動檢測等方法進行針對性優(yōu)化;在聲學建模層面,采用深度多流CNN與無監(jiān)督pre-training結(jié)合的方案,極大提升低資源場景下的非母語兒童語音識別性能。

圖:競賽系統(tǒng)最終排名,好未來(tal_speech)遙遙領(lǐng)先

競賽中,好未來最終提交的系統(tǒng)以絕對優(yōu)勢領(lǐng)先第二名奪得冠軍。該系統(tǒng)更加適配兒童語音識別場景,識別結(jié)果準確度更高,更重要的是這項技術(shù)的進階與應用,能夠更大程度地避免通用模型識別兒童語音不準確對孩子學習自信心和積極性造成的負面影響。

貼合學習需求,打造智慧教育新體驗

本次成功摘取“雙冠”的語音識別技術(shù),已經(jīng)廣泛應用于好未來旗下各教育產(chǎn)品中,解決教育場景中的真實問題。

一方面,好未來用AI語音技術(shù)充分調(diào)動孩子的積極性,為他們提供全新的學習體驗。如好未來將AI語音識別應用于語文、英語的字詞學習環(huán)節(jié),對學生語音實時轉(zhuǎn)錄,結(jié)合語音評測技術(shù),判斷學生對知識點的掌握度,智能地推送學習內(nèi)容,個性化地安排學習進度和學習路徑。

另一方面,AI語音技術(shù)也被應用到學而思培優(yōu)小班課的消息盒子與學而思網(wǎng)校大班課的語音彈幕功能中。該技術(shù)能夠?qū)⒑⒆拥陌l(fā)言實時展現(xiàn),及時反饋,激勵孩子主動融入課堂,探索學習的樂趣,讓課堂不再是老師的“獨角戲”。課后孩子與老師的互動同樣值得關(guān)注,不擅長打字的孩子,也可以在AI語音技術(shù)的幫助下參與到課后留言討論中,減少師生間的距離感,讓孩子更愿意表達。

不僅如此,在培養(yǎng)學生口語表達能力方面,AI語音技術(shù)也大有可為?!懊韧扌≈v師”是學而思培優(yōu)頗具代表性的線下口語表達活動,旨在培養(yǎng)孩子內(nèi)在自信、邏輯思維等能力。好未來自主研發(fā)的口語表達能力測評解決方案,支持從流利度、情感、內(nèi)容相關(guān)度、語義邏輯等多重維度,對孩子的口語表達過程進行實時評測,讓孩子隨時隨地進行口述題練習,并且及時獲得反饋報告,激發(fā)孩子的主動學習意識。

持續(xù)開放創(chuàng)新,用科技助力行業(yè)共生

AI語音技術(shù)的國際認可與創(chuàng)新應用,是好未來18年來用前沿科技推動教育進步的一個縮影。近年來,好未來獲批承建智慧教育國家新一代人工智能開放創(chuàng)新平臺,并與清華大學、中科院計算所等6所高校院所建立起緊密的產(chǎn)學研合作;為解決教育實際問題而生的幾十項學術(shù)成果入選ICASSP、NeurIPS、AAAI、WWW、EMNLP、AIED、NCME等國際頂級學術(shù)會議;好未來AI中臺也在2020年接連斬獲世界計算機視覺領(lǐng)域頂級會議CVPR-EmotioNet競賽冠軍、世界人機交互與普適計算領(lǐng)域頂級會議UbiComp競賽冠軍、中國計算語言學大會CCL2020競賽冠軍等榮譽,這都得益于好未來對科技研發(fā)的大力投入和對底層科研能力的不斷構(gòu)建。

好未來的AI探索已形成語音技術(shù)、視覺理解、自然語言處理和數(shù)據(jù)挖掘四大方向,探索落地從課前到課后、從內(nèi)容到服務、覆蓋“教、學、測、練、評”各教學環(huán)節(jié)的100余項AI能力、10余項教育場景AI解決方案,支撐包括學而思培優(yōu)、學而思網(wǎng)校、學而思1對1、小猴啟蒙、題拍拍等好未來旗下幾乎所有業(yè)務部門。

當前,科技已經(jīng)成為助推教育現(xiàn)代化發(fā)展和數(shù)字化轉(zhuǎn)型的重要力量。好未來希望用技術(shù)開放打破行業(yè)技術(shù)壁壘,依托智慧教育國家新一代人工智能開放創(chuàng)新平臺,用歷經(jīng)海量教育場景數(shù)據(jù)驗證迭代、在國際賽場“爭金奪銀”的技術(shù)能力,與行業(yè)協(xié)同創(chuàng)新,共同成就教育美好。

責任編輯:馬小龍

熱門推薦