-
數(shù)據(jù)標(biāo)注總規(guī)模達(dá)17282TB 高質(zhì)量數(shù)據(jù)集需加快建設(shè)
2025/4/6 15:01:46 來源:人民郵電報(bào) 【字體:大 中 小】【收藏本頁】【打印】【關(guān)閉】
核心提示:7個(gè)數(shù)據(jù)標(biāo)注基地的數(shù)據(jù)標(biāo)注總規(guī)模達(dá)到17282TB,已形成醫(yī)療、工業(yè)、教育等行業(yè)的高質(zhì)量數(shù)據(jù)集335個(gè)……國家數(shù)據(jù)局最新發(fā)布的數(shù)據(jù)顯示,我國數(shù)據(jù)標(biāo)注產(chǎn)業(yè)發(fā)展取得階段性成果。7個(gè)數(shù)據(jù)標(biāo)注基地的數(shù)據(jù)標(biāo)注總規(guī)模達(dá)到17282TB,已形成醫(yī)療、工業(yè)、教育等行業(yè)的高質(zhì)量數(shù)據(jù)集335個(gè)……國家數(shù)據(jù)局最新發(fā)布的數(shù)據(jù)顯示,我國數(shù)據(jù)標(biāo)注產(chǎn)業(yè)發(fā)展取得階段性成果。
數(shù)據(jù)標(biāo)注產(chǎn)業(yè)蓬勃發(fā)展
數(shù)據(jù)標(biāo)注產(chǎn)業(yè)是對數(shù)據(jù)進(jìn)行篩選、清洗、分類、注釋、標(biāo)記和質(zhì)量檢驗(yàn)等加工處理的新興產(chǎn)業(yè)。人工智能發(fā)展離不開高質(zhì)量數(shù)據(jù)集,而高質(zhì)量數(shù)據(jù)集建設(shè)離不開數(shù)據(jù)標(biāo)注工作。加快培育和發(fā)展數(shù)據(jù)標(biāo)注產(chǎn)業(yè),推進(jìn)數(shù)據(jù)要素市場化配置改革,對促進(jìn)數(shù)據(jù)開發(fā)利用、賦能經(jīng)濟(jì)社會發(fā)展、著力培育數(shù)據(jù)標(biāo)注新業(yè)態(tài)、布局?jǐn)?shù)字科技新賽道、構(gòu)建產(chǎn)業(yè)國際競爭新優(yōu)勢具有重要意義。
根據(jù)國家數(shù)據(jù)局最新發(fā)布的數(shù)據(jù),目前我國已建成7個(gè)數(shù)據(jù)標(biāo)注基地,分別位于四川成都、遼寧沈陽、安徽合肥、湖南長沙、海南海口、河北保定和山西大同,數(shù)據(jù)標(biāo)注總規(guī)模達(dá)到17282TB,相當(dāng)于中國國家圖書館數(shù)字資源總量的6倍左右。目前已形成醫(yī)療、工業(yè)、教育等行業(yè)的高質(zhì)量數(shù)據(jù)集335個(gè),賦能121個(gè)國產(chǎn)人工智能大模型研發(fā),引進(jìn)和培育標(biāo)注企業(yè)223家,標(biāo)注從業(yè)人員達(dá)5.8萬人,帶動數(shù)據(jù)標(biāo)注行業(yè)相關(guān)產(chǎn)值超過83億元。
數(shù)據(jù)標(biāo)注是提升人工智能算法、模型核心能力的關(guān)鍵環(huán)節(jié)。工信部信息通信經(jīng)濟(jì)專家委員會委員盤和林在接受《人民郵電》報(bào)記者采訪時(shí)表示,各地在數(shù)據(jù)標(biāo)注規(guī)模上實(shí)現(xiàn)了顯著增長,這顯示數(shù)據(jù)標(biāo)注產(chǎn)業(yè)在各地的快速擴(kuò)展和蓬勃發(fā)展,中國數(shù)據(jù)標(biāo)注產(chǎn)業(yè)的規(guī)模效應(yīng)正在逐步形成,競爭力正在不斷提高,可以預(yù)見,未來中國的數(shù)據(jù)標(biāo)注產(chǎn)業(yè)在海外也是有競爭力的。
“人工智能落地最大的障礙是應(yīng)用,而數(shù)據(jù)標(biāo)注產(chǎn)業(yè)向垂直領(lǐng)域延伸,則帶動人工智能產(chǎn)業(yè)向垂直領(lǐng)域融合,讓人工智能應(yīng)用和傳統(tǒng)產(chǎn)業(yè)領(lǐng)域更好融合。”盤和林表示,高質(zhì)量數(shù)據(jù)集將逐漸形成,特別是在醫(yī)療、工業(yè)、教育等多個(gè)關(guān)鍵行業(yè)領(lǐng)域,這些特色化數(shù)據(jù)標(biāo)注的出現(xiàn),也意味著各地?cái)?shù)據(jù)標(biāo)注產(chǎn)業(yè)通過多元化、垂直領(lǐng)域開發(fā)的方式來錯(cuò)開競爭,而不是單純堆量,這也有利于人工智能產(chǎn)業(yè)多點(diǎn)齊發(fā),最終有利于人工智能產(chǎn)業(yè)生態(tài)的形成。
推動數(shù)據(jù)標(biāo)注產(chǎn)業(yè)智能化發(fā)展
數(shù)據(jù)標(biāo)注產(chǎn)業(yè)作為數(shù)字經(jīng)濟(jì)領(lǐng)域的新業(yè)態(tài),是布局?jǐn)?shù)字科技新賽道、構(gòu)建產(chǎn)業(yè)競爭新優(yōu)勢的關(guān)鍵。根據(jù)國家發(fā)展改革委等部門2024年末發(fā)布的《關(guān)于促進(jìn)數(shù)據(jù)標(biāo)注產(chǎn)業(yè)高質(zhì)量發(fā)展的實(shí)施意見》,到2027年,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)專業(yè)化、智能化及科技創(chuàng)新能力顯著提升,產(chǎn)業(yè)規(guī)模大幅躍升,年均復(fù)合增長率超過20%,培育一批具有影響力的科技型數(shù)據(jù)標(biāo)注企業(yè),打造一批產(chǎn)學(xué)研用聯(lián)動的創(chuàng)新載體。
3月18日-20日,全國數(shù)據(jù)標(biāo)注基地先行先試現(xiàn)場會在四川成都舉行,會議要求,加快推進(jìn)高質(zhì)量數(shù)據(jù)集建設(shè),推動工業(yè)、金融、醫(yī)療、交通、教育等領(lǐng)域的高質(zhì)量數(shù)據(jù)集建設(shè),為人工智能高水平發(fā)展夯實(shí)數(shù)據(jù)底座。同時(shí),會議提出,因地制宜培育數(shù)據(jù)標(biāo)注產(chǎn)業(yè)。各地要立足自身優(yōu)勢和資源稟賦,找準(zhǔn)發(fā)展定位,探索特色發(fā)展路徑。通過差異化定位和特色化發(fā)展,形成優(yōu)勢互補(bǔ)、協(xié)同發(fā)展的產(chǎn)業(yè)格局。
加快建設(shè)高質(zhì)量的數(shù)據(jù)集,對于推動人工智能深入應(yīng)用,發(fā)揮人工智能在提升行業(yè)效率、改善服務(wù)質(zhì)量方面的巨大潛力具有重要意義。在醫(yī)療領(lǐng)域,通過收集和分析大量患者的醫(yī)療數(shù)據(jù),人工智能大模型可以為個(gè)性化治療提供建議;在金融領(lǐng)域,高質(zhì)量數(shù)據(jù)集可以用于風(fēng)險(xiǎn)評估、欺詐檢測、智能投顧;在工業(yè)領(lǐng)域,高質(zhì)量數(shù)據(jù)集可以支持智能制造、預(yù)測性維護(hù)、質(zhì)量控制等應(yīng)用。
3月24日,國家數(shù)據(jù)局局長劉烈宏在中國發(fā)展高層論壇2025年年會上表示,國家數(shù)據(jù)局將充分調(diào)動社會各方力量,積極推動高質(zhì)量數(shù)據(jù)集建設(shè),持續(xù)增加數(shù)據(jù)供給,推動“人工智能+”行動賦能千行百業(yè)。“'人工智能+'行動到哪里,高質(zhì)量數(shù)據(jù)集的建設(shè)和推廣就要到哪里。”劉烈宏說,將強(qiáng)化公共數(shù)據(jù)資源登記管理,規(guī)范公共數(shù)據(jù)資源授權(quán)運(yùn)營實(shí)施,建立授權(quán)運(yùn)營價(jià)格形成機(jī)制,積極引導(dǎo)做好高質(zhì)量數(shù)據(jù)集建設(shè)工作。
“從當(dāng)?shù)匾呀?jīng)形成的產(chǎn)業(yè)和數(shù)據(jù)格局出發(fā),找到具有優(yōu)勢數(shù)據(jù)資源的領(lǐng)域,有針對性地開發(fā)這些數(shù)據(jù),繼而由這些數(shù)據(jù)帶動相關(guān)產(chǎn)業(yè)實(shí)現(xiàn)'人工智能+'。”盤和林表示,對于擁有豐富醫(yī)療資源和數(shù)據(jù)的地區(qū),可以重點(diǎn)發(fā)展醫(yī)療領(lǐng)域的數(shù)據(jù)標(biāo)注產(chǎn)業(yè),專注于醫(yī)療影像、病歷文本等數(shù)據(jù)的標(biāo)注;對于工業(yè)基礎(chǔ)雄厚、制造業(yè)發(fā)達(dá)的地區(qū),可以重點(diǎn)發(fā)展工業(yè)領(lǐng)域的數(shù)據(jù)標(biāo)注產(chǎn)業(yè),專注于工業(yè)設(shè)備狀態(tài)監(jiān)測、生產(chǎn)線優(yōu)化等數(shù)據(jù)的標(biāo)注,為工業(yè)人工智能的研發(fā)提供有力支撐。
高質(zhì)量的數(shù)據(jù)標(biāo)注是訓(xùn)練高性能人工智能模型的基礎(chǔ),只有準(zhǔn)確、全面地標(biāo)注數(shù)據(jù),才能訓(xùn)練出可靠、可用的人工智能大模型。數(shù)據(jù)標(biāo)注產(chǎn)業(yè)也需要緊密配合人工智能技術(shù)的研發(fā)和應(yīng)用需求,提供定制化的數(shù)據(jù)標(biāo)注服務(wù),為人工智能技術(shù)的創(chuàng)新和應(yīng)用提供有力支持。
“數(shù)據(jù)標(biāo)注產(chǎn)業(yè)會朝著更專業(yè)化、規(guī)模化、智能化的方向發(fā)展。”盤和林表示,一方面,隨著人工智能技術(shù)的不斷進(jìn)步和應(yīng)用場景的不斷拓展,對數(shù)據(jù)標(biāo)注的需求將會越來越大,對數(shù)據(jù)標(biāo)注的質(zhì)量和效率也會提出更高的要求。另一方面,人工智能技術(shù)也將對數(shù)據(jù)標(biāo)注產(chǎn)業(yè)產(chǎn)生影響,很多數(shù)據(jù)標(biāo)注可能不再是由人來標(biāo)注,而是由算法標(biāo)注,不僅如此,數(shù)據(jù)本身可能就是由人工智能生成的,這又會給數(shù)據(jù)標(biāo)注產(chǎn)業(yè)帶來顛覆性的影響。
轉(zhuǎn)自:人民郵電報(bào)
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如有侵權(quán)行為,請第一時(shí)間聯(lián)系我們修改或刪除,郵箱:cidr@chinaidr.com。- 上一篇:春游鄉(xiāng)村好去處“上新”
- 下一篇:家電行業(yè)營收增長9.9%
- 熱點(diǎn)資訊
- 24小時(shí)
- 周排行
- 月排行
- 翩藍(lán)柔律,永恒翩躚 大麗和和臻呈獨(dú)一款藍(lán)寶石高級珠寶項(xiàng)鏈
- 平涂教育:專注線上插畫學(xué)習(xí)
- 旭合科技閃耀2025 SNEC,以創(chuàng)新技術(shù)引領(lǐng)全球能源轉(zhuǎn)型新浪潮
- 市場監(jiān)管總局:3605批次冷凍飲品抽檢合格率超99.5%
- “尋味北疆·暖城好羊”美食品鑒會解鎖烏審旗農(nóng)畜產(chǎn)品流量密碼
- 得力攜哪吒震撼首發(fā)!國潮IP+黑科技打開CSF文化會新視界
- 邁向綠色新質(zhì)生產(chǎn)力:米納威巖礦板的轉(zhuǎn)型躍升之路
- AI黑馬誕生!法大大榮獲金融科技國際創(chuàng)新大賽第三名
- 中國質(zhì)造榮耀出海|米納威巖礦板亮相2025悉尼國際建材展,燃動國際視線
- 5月金融總量合理增長 有力支持實(shí)體經(jīng)濟(jì)