-
王立非:語言數(shù)據(jù)產(chǎn)業(yè)是推動數(shù)字經(jīng)濟發(fā)展的重要力量
2025/5/10 11:55:01 來源:中國產(chǎn)業(yè)發(fā)展研究網(wǎng) 【字體:大 中 小】【收藏本頁】【打印】【關閉】
核心提示:在數(shù)字經(jīng)濟蓬勃發(fā)展的浪潮中,語言數(shù)據(jù)產(chǎn)業(yè)成為推動經(jīng)濟高質量發(fā)展的重要力量。在數(shù)字經(jīng)濟蓬勃發(fā)展的浪潮中,語言數(shù)據(jù)產(chǎn)業(yè)成為推動經(jīng)濟高質量發(fā)展的重要力量。國家出臺《促進和規(guī)范數(shù)據(jù)跨境流動規(guī)定》《關于加強數(shù)字中文建設,推進語言文字信息化發(fā)展的意見》《信息技術產(chǎn)品國家通用語言文字使用管理規(guī)定》等政策,凸顯語言數(shù)據(jù)作為數(shù)據(jù)要素的核心地位。該產(chǎn)業(yè)涵蓋語言資源的采集、標注、加工及應用服務,伴隨人工智能對訓練語料的需求激增,逐步從技術領域獨立為新興戰(zhàn)略產(chǎn)業(yè),經(jīng)濟價值與戰(zhàn)略意義顯著。一、我國語言數(shù)據(jù)產(chǎn)業(yè)發(fā)展
從產(chǎn)業(yè)發(fā)展階段看,20世紀80年代,我國首批語言數(shù)據(jù)企業(yè)誕生,但規(guī)模有限;90年代改革開放深化推動市場快速成長,企業(yè)數(shù)量年均增超40%。21世紀后,大數(shù)據(jù)與互聯(lián)網(wǎng)普及使語言數(shù)據(jù)價值凸顯,語音識別等技術推動標注需求增長。2014年數(shù)字經(jīng)濟戰(zhàn)略實施后,產(chǎn)業(yè)進入成熟整合期,形成頭部企業(yè)與中小企業(yè)并存的格局。從產(chǎn)業(yè)規(guī)模看,截至2024年底,市場規(guī)模突破249.1億元,企業(yè)達1.6739萬家,其中,1.6222萬家含語言數(shù)據(jù)服務的企業(yè)貢獻了95.43%產(chǎn)值,體現(xiàn)“嵌入式服務”與“垂直專業(yè)化”并存的產(chǎn)業(yè)特征。從產(chǎn)業(yè)分布看,語言數(shù)據(jù)產(chǎn)業(yè)地域分布呈現(xiàn)東部沿海集聚態(tài)勢,東部占比73.5%企業(yè)和85.23%產(chǎn)值,中西部及東北基礎薄弱。東部優(yōu)勢源于數(shù)字產(chǎn)業(yè)基礎、人才及與人工智能產(chǎn)業(yè)的協(xié)同效應。近年來,“東數(shù)西算”工程推動算力西遷,成渝等西部樞紐帶動區(qū)域企業(yè)增長,產(chǎn)業(yè)擴散呈現(xiàn)“沿海-內陸”層級擴散與鄰接擴散并存趨勢。
二、我國語言數(shù)據(jù)產(chǎn)業(yè)自主知識體系創(chuàng)新
首先,我國的語言數(shù)據(jù)產(chǎn)業(yè)技術創(chuàng)新不斷增長。2012-2020年專利授權量年均增21%,語音處理與多模態(tài)數(shù)據(jù)處理為核心方向,技術融合催生跨領域專利。產(chǎn)學研協(xié)同創(chuàng)新顯著,騰訊、阿里、清華等企業(yè)與高校發(fā)揮關鍵作用,但創(chuàng)新資源仍集中北京、廣東等發(fā)達地區(qū)。其次,語言數(shù)據(jù)產(chǎn)業(yè)協(xié)同力度不斷加大。語言數(shù)據(jù)產(chǎn)業(yè)與數(shù)字經(jīng)濟及下游智能語言服務產(chǎn)業(yè)聯(lián)動緊密。研究表明,語言數(shù)據(jù)產(chǎn)業(yè)的產(chǎn)值每增1億元,數(shù)字經(jīng)濟指數(shù)提升0.0485,下游智能服務產(chǎn)值增0.55億元。生成式AI的爆發(fā)進一步帶動需求,因此,需要加強產(chǎn)業(yè)協(xié)同與場景對接。此外,語言數(shù)據(jù)相關制度保障不斷完善。《數(shù)據(jù)安全法》和《全面加強新時代語言文字工作意見》等政策構建合規(guī)框架;教育部和國家語委等部門大力推動語言數(shù)據(jù)資源庫建設;語言數(shù)據(jù)標準化體系逐步完善,如《雙語平行語料加工服務基本要求》等國家標準規(guī)范行業(yè)發(fā)展。
三、建議
針對語言數(shù)據(jù)產(chǎn)業(yè)快速發(fā)展面臨的挑戰(zhàn)和機遇,我建議,一是將語言數(shù)據(jù)納入語言戰(zhàn)略規(guī)劃和數(shù)字經(jīng)濟規(guī)劃,將語言數(shù)據(jù)納入AI、文化數(shù)字化等頂層設計,協(xié)同算力工程,強化語料資源與人才培養(yǎng)鏈條。二是激活數(shù)據(jù)要素價值,建立確權登記制度,完善數(shù)據(jù)資產(chǎn)交易與定價機制,提升交易透明度與收益分配公平性。三是打造區(qū)域示范高地,依托北京中關村、成渝雙城等區(qū)域建設國家級示范區(qū),推動全鏈條落地,納入數(shù)字經(jīng)濟考核體系。四是創(chuàng)新驅動數(shù)據(jù)供給,攻關多模態(tài)標注、隱私計算等技術,對接國際標準,健全知識產(chǎn)權保護與眾包激勵機制。五是擴大國際影響力,輸出“一帶一路”數(shù)據(jù)發(fā)展的中國方案,擴大數(shù)據(jù)標準制定與規(guī)則話語權。
數(shù)字經(jīng)濟時代,語言數(shù)據(jù)產(chǎn)業(yè)已成為新質生產(chǎn)力的“新引擎”。通過戰(zhàn)略統(tǒng)籌、制度創(chuàng)新、區(qū)域協(xié)同與技術突破,我國將鞏固全球數(shù)字經(jīng)濟競爭中的優(yōu)勢地位,為高質量發(fā)展提供堅實基座。
(作者簡介:王立非,博士,北京語言大學教授,中西創(chuàng)新學院特聘教授,四川外國語大學“巴渝學者”)
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如有侵權行為,請第一時間聯(lián)系我們修改或刪除,多謝。