動感語言文字中的自動化科技：國務(wù)院辦公廳關(guān)于全面加強新時代語言文字工作的意見

時間：2021-12-01 18:59:49 發(fā)布：自動化網(wǎng) 來源：中國政府網(wǎng) 第一對焦：國務(wù)院辦公廳

國務(wù)院辦公廳關(guān)于全面加強新時代

語言文字工作的意見

（一）指導(dǎo)思想。以習(xí)近平新時代中國特色社會主義思想為指導(dǎo)，全面貫徹黨的十九大和十九屆二中、三中、四中全會精神，按照黨中央、國務(wù)院決策部署，堅持以人民為中心的發(fā)展思想，以推廣普及和規(guī)范使用國家通用語言文字為重點，加強語言文字法治建設(shè)，推進語言文字規(guī)范化、標(biāo)準(zhǔn)化、信息化建設(shè)，科學(xué)保護各民族語言文字，構(gòu)建和諧健康語言生活，傳承弘揚中華優(yōu)秀語言文化，提升國家文化軟實力，為鑄牢中華民族共同體意識、建設(shè)社會主義現(xiàn)代化強國貢獻力量。

——堅持服務(wù)大局、服務(wù)人民。立足我國發(fā)展新的歷史方位，聚焦國家發(fā)展戰(zhàn)略，加強頂層設(shè)計，充分發(fā)揮語言文字的政治、社會、文化、育人和對外交流功能，提高語言文字工作服務(wù)國家發(fā)展大局的能力，推進語言文字工作治理體系和治理能力現(xiàn)代化，服務(wù)人民群眾學(xué)習(xí)使用語言文字和提升科學(xué)文化素質(zhì)的需求。

——堅持遵循規(guī)律、分類指導(dǎo)。準(zhǔn)確把握我國語言國情，遵循語言文字發(fā)展規(guī)律，牢固確立國家通用語言文字的主體地位，樹立科學(xué)語言文字觀，改革創(chuàng)新、穩(wěn)中求進、因地制宜、分類施策，妥善處理好各類語言文字關(guān)系，構(gòu)建和諧健康語言生活。

（三）主要目標(biāo)。到2025年，普通話在全國普及率達(dá)到85%，語言文字規(guī)范化、標(biāo)準(zhǔn)化、信息化水平進一步提高，語言文字科技水平和創(chuàng)新能力明顯提升，中華優(yōu)秀語言文化得到更好傳承弘揚，與人民群眾需求相適應(yīng)的語言服務(wù)體系更加完善。

到2035年，國家通用語言文字在全國范圍內(nèi)的普及更全面、更充分，普通話在民族地區(qū)、農(nóng)村地區(qū)的普及率顯著提高，國家語言文字事業(yè)取得長足發(fā)展，基本實現(xiàn)新時代語言文字工作治理體系和治理能力現(xiàn)代化。

二、堅定不移推廣普及國家通用語言文字

（五）堅持學(xué)校作為國家通用語言文字教育基礎(chǔ)陣地。加強學(xué)校語言文字工作，全面落實國家通用語言文字作為教育教學(xué)基本用語用字的法定要求。堅持把語言文字規(guī)范化要求納入學(xué)校、教師、學(xué)生管理和教育教學(xué)、評估評價等各個環(huán)節(jié)，開展學(xué)校語言文字工作達(dá)標(biāo)建設(shè)。建立完善學(xué)生語言文字應(yīng)用能力監(jiān)測和評價標(biāo)準(zhǔn)。大力提高教師國家通用語言文字核心素養(yǎng)和教學(xué)能力。加強教材建設(shè)，確保國家通用語言文字規(guī)范標(biāo)準(zhǔn)的貫徹落實。建設(shè)書香校園，提高學(xué)生國家通用語言文字聽說讀寫能力和語文素養(yǎng)。除國家另有規(guī)定外，學(xué)位論文應(yīng)當(dāng)使用國家通用語言文字撰寫。

（七）提升國民語言文字應(yīng)用能力。學(xué)校、機關(guān)、新聞出版、廣播影視、網(wǎng)絡(luò)信息、公共服務(wù)等系統(tǒng)相關(guān)從業(yè)人員，國家通用語言文字水平應(yīng)達(dá)到國家規(guī)定的等級標(biāo)準(zhǔn)。開展國家通用語言文字示范培訓(xùn)，提高教師、基層干部等人群國家通用語言文字應(yīng)用能力。開發(fā)普通話學(xué)習(xí)資源。推進普通話水平測試，完善國家通用語言文字應(yīng)用能力測評體系。開展國民語言教育，提升國民語言文化素養(yǎng)，提高國民語言能力。

三、加快推進語言文字基礎(chǔ)能力建設(shè)

（九）推動語言文字信息技術(shù)創(chuàng)新發(fā)展。發(fā)揮語言文字信息技術(shù)在國家信息化、智能化建設(shè)中的基礎(chǔ)支撐作用，提升語言文字信息處理能力，推進語言文字的融媒體應(yīng)用。大力推動語言文字與人工智能、大數(shù)據(jù)、云計算等信息技術(shù)的深度融合，加強人工智能環(huán)境下自然語言處理等關(guān)鍵問題研究和原創(chuàng)技術(shù)研發(fā)，加強語言技術(shù)成果轉(zhuǎn)化及推廣應(yīng)用，支持?jǐn)?shù)字經(jīng)濟發(fā)展。加強語言文字信息化平臺建設(shè)，建設(shè)好全球中文學(xué)習(xí)平臺，提供優(yōu)質(zhì)學(xué)習(xí)資源和信息服務(wù)資源。

（十一）研究制定國家語言發(fā)展規(guī)劃。加強國家語言發(fā)展規(guī)劃，將國家通用語言文字推廣普及、語言文字規(guī)范化標(biāo)準(zhǔn)化信息化建設(shè)、民族語文教育、語言資源保護利用、外語教育、國際中文教育、語言人才培養(yǎng)等統(tǒng)一規(guī)劃、統(tǒng)一部署。完善高校多語種外語教育規(guī)劃和語種結(jié)構(gòu)，培養(yǎng)和儲備復(fù)合型語言人才。加強語言產(chǎn)業(yè)規(guī)劃研究。堅持政府引導(dǎo)與市場運營相結(jié)合，發(fā)展語言智能、語言教育、語言翻譯、語言創(chuàng)意等語言產(chǎn)業(yè)。

（十三）滿足人民群眾多樣化語言需求。建立語言服務(wù)機制，建設(shè)國家語言志愿服務(wù)隊伍。提升城鄉(xiāng)社區(qū)語言服務(wù)能力，提高少數(shù)民族進城務(wù)工經(jīng)商人員語言文化服務(wù)質(zhì)量。編制發(fā)布國內(nèi)外語言政策和語言生活狀況報告。加快手語和盲文規(guī)范化、標(biāo)準(zhǔn)化、信息化建設(shè)，加快推廣國家通用手語和國家通用盲文，加強手語、盲文學(xué)科建設(shè)和人才培養(yǎng)，為聽力、視力殘疾人提供無障礙語言文字服務(wù)。為來華旅游、留學(xué)、工作、居住人員提供語言服務(wù)。

五、積極推進中華優(yōu)秀語言文化傳承發(fā)展

（十五）深化與港澳臺地區(qū)語言文化交流合作。支持和服務(wù)港澳地區(qū)開展普通話教育，合作開展普通話水平測試，提高港澳地區(qū)普通話應(yīng)用水平。加大與港澳臺地區(qū)青少年語言文化交流力度，組織開展中華經(jīng)典誦讀展演、語言文化研修等活動。加強與港澳臺地區(qū)在科技術(shù)語、中文信息技術(shù)、語言文字科學(xué)研究和人才培養(yǎng)等方面的交流合作。加強臺灣地區(qū)語言文字政策研究。

（十七）加強國際中文教育和服務(wù)。加強國際中文教師隊伍建設(shè)。吸引更多海外中文教師來華攻讀中文國際教育相關(guān)碩士博士學(xué)位。構(gòu)建全球普通話水平測試體系。完善國際中文教育考試標(biāo)準(zhǔn)。加強中文在海外華文學(xué)校的推廣應(yīng)用，加強海外華文教師培訓(xùn)。大力提升中文在學(xué)術(shù)領(lǐng)域的影響力，提倡科研成果中文首發(fā)。推動提高中文在國際組織、國際會議的使用地位和使用比例。促進漢語拼音的國際應(yīng)用。

（十九）加強黨對語言文字工作的領(lǐng)導(dǎo)。把堅持和加強黨的領(lǐng)導(dǎo)貫穿語言文字工作全過程。各級政府要高度重視語言文字工作，切實把語言文字工作納入政府議事日程和相關(guān)工作績效管理目標(biāo)，建立健全工作機制、配足配齊工作人員。綜合運用法律、行政、教育、科技等手段，履行政府依法監(jiān)管語言文字應(yīng)用和提供語言文字公共服務(wù)的職責(zé)，加快推進語言文字工作治理體系和治理能力現(xiàn)代化。把語言文字工作納入各級政府履行教育職責(zé)評價體系，省級人民政府語言文字工作重要事項要及時向國家語委報告。強化縣鄉(xiāng)兩級國家通用語言文字工作職能。

（二十一）夯實語言文字工作法治基礎(chǔ)。貫徹落實國家通用語言文字法。推動完善語言文字法律制度，制定相關(guān)配套規(guī)章。依法加強管理，確保國家通用語言文字作為機關(guān)的公務(wù)用語用字，作為學(xué)校、新聞出版、廣播影視、公共服務(wù)等領(lǐng)域的基本用語用字。指導(dǎo)地方根據(jù)國家通用語言文字法的規(guī)定，完善相關(guān)地方性法規(guī)。將語言文字規(guī)范化要求納入相關(guān)行業(yè)法規(guī)規(guī)章和規(guī)范標(biāo)準(zhǔn)。推動開展國家通用語言文字法執(zhí)法檢查。健全語言文字依法管理和執(zhí)法監(jiān)督協(xié)調(diào)機制。將語言文字法律法規(guī)的學(xué)習(xí)宣傳納入普法規(guī)劃和普法教育內(nèi)容。

（二十二）加強語言文字工作隊伍建設(shè)。加強語言文字系統(tǒng)干部隊伍培養(yǎng)培訓(xùn)，提高語言文字工作治理能力和水平。開展普通話水平測試員、相關(guān)行業(yè)從業(yè)人員語言文字培訓(xùn)。完善人才培養(yǎng)和使用機制，建設(shè)高質(zhì)量語言文字科研人才隊伍。健全激勵機制，依法依規(guī)表彰獎勵為語言文字事業(yè)發(fā)展作出突出貢獻的組織和個人。

國務(wù)院辦公廳

動感語言文字工作：第十六屆中國中文信息學(xué)會暑期校暨《前沿技術(shù)講習(xí)班》（CIPS ATT）在京召開

中科院自動化所劉康研究員和中科院軟件所韓先培研究員作題為《Research：the Good, the Bad and the Ugly》的報告

慶祝中國中文信息學(xué)會成立40周年系列活動 - 第十六屆中國中文信息學(xué)會暑期學(xué)校暨《前沿技術(shù)講習(xí)班》（CIPS ATT）在京召開

2021年7月22日-25日，慶祝中國中文信息學(xué)會成立40周年系列活動 - 第十六屆中國中文信息學(xué)會暑期學(xué)校暨《前沿技術(shù)講習(xí)班》第二十三期和第二十四期在京舉行。本屆講習(xí)班主題為：預(yù)訓(xùn)練語言模型的基礎(chǔ)理論與方法及其典型應(yīng)用。講習(xí)班吸引了來自全國各高校及科研院所的專家、學(xué)者、學(xué)生、產(chǎn)業(yè)界研發(fā)人員等近400人參加。

哈爾濱工業(yè)大學(xué)車萬翔教授、清華大學(xué)劉知遠(yuǎn)副教授、中國科學(xué)院自動化研究所張家俊研究員擔(dān)任本屆講習(xí)班的學(xué)術(shù)主席。劉知遠(yuǎn)副教授和車萬翔教授分別致開幕辭，先后介紹了講習(xí)班的課程內(nèi)容和特邀講者，并歡迎學(xué)員們來京參會！

講習(xí)班邀請了哈爾濱工業(yè)大學(xué)車萬翔教授、科大訊飛崔一鳴研究員、微軟亞洲研究院董力研究員、百度公司孫宇研究員、清華大學(xué)劉知遠(yuǎn)副教授、循環(huán)智能楊植麟博士、復(fù)旦大學(xué)邱錫鵬教授、上海交通大學(xué)趙海教授、字節(jié)跳動王明軒研究員、清華大學(xué)黃民烈副教授、中國人民大學(xué)趙鑫副教授和陳旭助理教授、中科院計算所郭嘉豐教授和范意興助理研究員、清華大學(xué)蘭艷艷教授、中科院自動化所劉康研究員和中科院軟件所韓先培研究員在不同的方向作了系統(tǒng)深入的講解，并對預(yù)訓(xùn)練模型及其各領(lǐng)域的應(yīng)用提出了未來的研究方向。

7月22日，車萬翔教授和崔一鳴研究員作題為《自然語言處理：基于預(yù)訓(xùn)練模型的方法》的報告，重點介紹基于預(yù)訓(xùn)練模型的自然語言處理技術(shù)，包括基礎(chǔ)知識、預(yù)訓(xùn)練詞向量和預(yù)訓(xùn)練模型三大部分?；A(chǔ)知識部分介紹自然語言處理和深度學(xué)習(xí)的基礎(chǔ)知識和基本工具；預(yù)訓(xùn)練詞向量部分介紹靜態(tài)詞向量和動態(tài)詞向量的預(yù)訓(xùn)練方法及應(yīng)用方法；預(yù)訓(xùn)練模型部分介紹幾種典型的預(yù)訓(xùn)練語言模型和應(yīng)用，以及預(yù)訓(xùn)練模型的最新進展。除理論知識外，還結(jié)合具體代碼進行深入介紹，達(dá)到理論和實踐的統(tǒng)一。車萬翔教授作題為《自然語言處理：基于預(yù)訓(xùn)練模型的方法》的報告

崔一鳴研究員作題為《自然語言處理：基于預(yù)訓(xùn)練模型的方法》的報告

7月23日上午，董力研究員作題為《跨語言預(yù)訓(xùn)練模型》的報告，主要介紹跨語言預(yù)訓(xùn)練的最新研究進展與趨勢，對當(dāng)前跨語言預(yù)訓(xùn)練方法、微調(diào)技術(shù)；同時，還將介紹跨語言文本理解與生成的常用評測方式。此外，對當(dāng)前跨語言預(yù)訓(xùn)練研究面臨的挑戰(zhàn)進行了探討。

孫宇研究員作題為《跨模態(tài)預(yù)訓(xùn)練模型》的報告，融合跨模態(tài)知識、跨模態(tài)對抗訓(xùn)練、多個模態(tài)統(tǒng)一建模等是跨模態(tài)預(yù)訓(xùn)練的新思路。報告針對語言-視覺、語言-語音跨模態(tài)預(yù)訓(xùn)練，介紹該領(lǐng)域最新的進展和趨勢。

董力研究員作題為《跨語言預(yù)訓(xùn)練模型》的報告

孫宇研究員作題為《跨模態(tài)預(yù)訓(xùn)練模型》的報告

下午，劉知遠(yuǎn)副教授作題為《知識指導(dǎo)的預(yù)訓(xùn)練語言模型》的報告，作為典型的數(shù)據(jù)驅(qū)動方法，以預(yù)訓(xùn)練語言模型為代表的深度學(xué)習(xí)仍然面臨可解釋性不強、魯棒性差等難題，如何將人類積累的大量語言知識和世界知識引入模型，是改進深度學(xué)習(xí)性能的重要方向，同時也面臨很多挑戰(zhàn)。報告系統(tǒng)介紹了知識指導(dǎo)的預(yù)訓(xùn)練語言模型的最新進展與趨勢。

楊植麟博士作題為《面向生成的預(yù)訓(xùn)練模型》的報告，探討如何在紛繁復(fù)雜的任務(wù)體系和架構(gòu)體系當(dāng)中尋找統(tǒng)一的解決方案，其中將重點討論「生成理解一體化」的思想，討論基于生成的方式如何統(tǒng)一預(yù)訓(xùn)練和微調(diào)任務(wù)。同時，報告還討論了基于生成的思想在少樣本學(xué)習(xí)、知識探測、詩歌生成等下游任務(wù)的應(yīng)用，以及基于生成的預(yù)訓(xùn)練模型在工業(yè)界對話理解場景的落地案例。

劉知遠(yuǎn)副教授作題為《知識指導(dǎo)的預(yù)訓(xùn)練語言模型》的報告

楊植麟博士作題為《面向生成的預(yù)訓(xùn)練模型》的報告

7月24日上午，邱錫鵬教授作題為《預(yù)訓(xùn)練模型在NLP基礎(chǔ)任務(wù)中的應(yīng)用》的報告，介紹預(yù)訓(xùn)練模型在NLP基礎(chǔ)任務(wù)上的應(yīng)用，主要包括1）如何在下游任務(wù)精調(diào)預(yù)訓(xùn)練模型；2）在NLP基礎(chǔ)任務(wù)上的應(yīng)用；3）重點介紹了一種統(tǒng)一生成框架，可以用來解決眾多NLP基礎(chǔ)任務(wù)。

趙海教授作題為《預(yù)訓(xùn)練模型在機器閱讀理解任務(wù)中的應(yīng)用》的報告，主要探討語言模型、表示對于機器閱讀理解的技術(shù)性影響，包括技術(shù)演化的時間線、現(xiàn)狀和挑戰(zhàn)，特別是最近一年的最新進展和一些個人新的思考。

邱錫鵬教授作題為《預(yù)訓(xùn)練模型在NLP基礎(chǔ)任務(wù)中的應(yīng)用》的報告

趙海教授作題為《預(yù)訓(xùn)練模型在機器閱讀理解任務(wù)中的應(yīng)用》的報告

下午，王明軒研究員作題為《機器翻譯的預(yù)訓(xùn)練方法》的報告，報告圍繞單語預(yù)訓(xùn)練、多語言預(yù)訓(xùn)練、多模態(tài)預(yù)訓(xùn)練三個方面來介紹機器翻譯中利用預(yù)訓(xùn)練提升的最新進展。預(yù)訓(xùn)練在機器翻譯中需要達(dá)到三個目標(biāo)：設(shè)計有效目標(biāo)從而適應(yīng)翻譯任務(wù)；充分利用大量單語和有限雙語、文本和不同模態(tài)數(shù)據(jù)；拉近跨語言跨任務(wù)表示。通過預(yù)訓(xùn)練和細(xì)調(diào)方法，在雙語翻譯，多語言聯(lián)合翻譯（包括zero-shot場景），語音翻譯，圖像輔助翻譯等不同翻譯場景都取得了顯著提升。

黃民烈副教授作題為《基于預(yù)訓(xùn)練模型的對話系統(tǒng)》的報告，報告圍繞基于預(yù)訓(xùn)練模型的對話系統(tǒng)，闡述其中重要的問題、挑戰(zhàn)，以及最新的方法，特別是大數(shù)據(jù)、大模型下的框架和任務(wù)設(shè)計。

王明軒研究員作題為《機器翻譯的預(yù)訓(xùn)練方法》的報告

黃民烈副教授作題為《基于預(yù)訓(xùn)練模型的對話系統(tǒng)》的報告

7月25日上午，趙鑫副教授和陳旭助理教授作題為《預(yù)訓(xùn)練模型在推薦系統(tǒng)中的應(yīng)用》的報告，聚焦預(yù)訓(xùn)練模型在推薦系統(tǒng)領(lǐng)域的應(yīng)用，對最近幾年的相關(guān)研究進行簡要梳理和回顧，主要內(nèi)容包括：1）基礎(chǔ)背景：預(yù)訓(xùn)練模型和推薦系統(tǒng)的相關(guān)背景知識；2）預(yù)訓(xùn)練模型在推薦系統(tǒng)中應(yīng)用的動機和挑戰(zhàn)：為什么預(yù)訓(xùn)練模型在推薦系統(tǒng)領(lǐng)域受到廣泛關(guān)注，應(yīng)用過程中的主要難點是什么；3）預(yù)訓(xùn)練模型在推薦系統(tǒng)中的應(yīng)用策略和相關(guān)方法：如何更好地利用推薦系統(tǒng)中用戶的行為數(shù)據(jù)、設(shè)計更好的模型架構(gòu)和學(xué)習(xí)算法；4）預(yù)訓(xùn)練模型在推薦系統(tǒng)中應(yīng)用的未來展望：該領(lǐng)域亟待解決的問題和未來的發(fā)展方向。

郭嘉豐研究員和范意興助理研究員作題為《預(yù)訓(xùn)練模型在信息檢索中的應(yīng)用》的報告，聚焦預(yù)訓(xùn)練模型在信息檢索中的應(yīng)用，對最近幾年的相關(guān)研究進行系統(tǒng)的梳理和回顧。主要內(nèi)容包括：1）基礎(chǔ)背景：信息檢索的相關(guān)背景知識介紹；2）預(yù)訓(xùn)練模型在檢索召回階段的應(yīng)用：包括預(yù)訓(xùn)練模型在傳統(tǒng)稀疏檢索框架下的應(yīng)用以及基于預(yù)訓(xùn)練模型的稠密檢索方法；3）預(yù)訓(xùn)練模型在重排序階段的應(yīng)用：包括基于預(yù)訓(xùn)練模型的表示學(xué)習(xí)、交互學(xué)習(xí)建模方法與模型加速，以及基于生成模型的排序建模等；4）面向信息檢索的預(yù)訓(xùn)練模型設(shè)計：如何構(gòu)建滿足信息檢索任務(wù)需求的自監(jiān)督學(xué)習(xí)任務(wù)，進一步提升信息檢索的性能。

趙鑫副教授作題為《預(yù)訓(xùn)練模型在推薦系統(tǒng)中的應(yīng)用》的報告

陳旭助理教授作題為《預(yù)訓(xùn)練模型在推薦系統(tǒng)中的應(yīng)用》的報告

郭嘉豐研究員作題為《預(yù)訓(xùn)練模型在信息檢索中的應(yīng)用》的報告

范意興助理研究員作題為《預(yù)訓(xùn)練模型在信息檢索中的應(yīng)用》的報告

下午，蘭艷艷教授作題為《學(xué)術(shù)論文寫作的一些體會》的報告，結(jié)合個人研究背景和經(jīng)歷，主要介紹了學(xué)術(shù)論文寫作的一些體會，包括邏輯的重要性，3W2H寫作法則，論文的潤色技巧，復(fù)盤與提高等。

劉康研究員和韓先培研究員作題為《Research：the Good, the Bad and the Ugly》的報告，介紹兩位講者在多年的科研經(jīng)歷中遇到過、看到過、聽到過的Good、Bad、Ugly的科研方法（包括但不限于其中的故事、心態(tài)、理念、方法等），希望對于同學(xué)們的學(xué)習(xí)、科研和生活有所幫助。