國家數據局:我國7個數據標注基地已建設數據集524個 服務大模型163個
關鍵詞: 國家數據局,高質量數據集,數據要素市場化,數據產業,2025 數博會
7月22日,國家數據局舉行2025中國國際大數據產業博覽會新聞發布會。記者從會上獲悉,我國全面加速高質量數據集建設和應用落地,進一步推動數據要素市場化、價值化,為培育新質生產力提供堅實的數據支撐。截至上半年,7個數據標注基地已建設數據集524個,規模超過29PB,服務大模型163個。下一步,國家數據局將多措并舉,進一步優化產業規劃布局,推動數據產業從“單點突破”向“全域發展”轉變。
國家數據局副局長余英表示,數據,特別是高質量、多模態、精標注的數據對人工智能發展至關重要,在提質賦能中發揮關鍵作用,是人工智能發展的不竭動力。中國在人工智能領域取得的成果與數據工作的創新實踐密不可分。
余英介紹,高質量數據集是經過采集、加工等數據處理,可以直接用于開發和訓練人工智能模型的數據集,能夠有效地提升模型性能。我們日常生活中把高質量數據集分為三類:第一類是通識類,第二類是行業通識類,第三類是行業專識類。
余英表示,國家數據局組織開展生態培育專項行動,主要包括三方面內容:一是組織開展高質量數據集典型案例征集和示范推廣,挖掘醫療、工業、交通等重點領域標桿實踐;二是定期舉辦技術交流活動,圍繞數據標注、合成及高質量數據集建設方法論等開展深度研討;三是搭建常態化供需對接平臺,促進數據供給方、技術提供方、場景應用方精準匹配。同時還指導合肥、成都等7個城市建設數據標注基地,先行先試探索數據標注產業發展經驗。
去年12月,國家數據局會同國家發展改革委、教育部、財政部、金融監管總局、中國證監會等5部門印發《關于促進數據產業高質量發展的指導意見》,聚焦數據產業發展現狀和市場需求,推動培育多元經營主體,營造競爭有序、繁榮活躍的數據產業生態。
對于數據產業的發展,余英表示,發展數據產業是推進數據要素市場化配置改革、加快構建以數據為關鍵要素的數字經濟的重要舉措,也是發展新質生產力、培育新動能新優勢的必然要求。充分發揮我國規模市場和海量數據雙優勢,大力發展數據產業,培育新的經濟增長點,已成為各方共識和共同期盼。
余英介紹,近期,各地立足發展基礎,加快謀篇布局,搶抓數據產業發展機遇。上海、河南等地制定出臺促進數據產業發展的實施意見或專項政策,山東、山西等地紛紛開展數據企業培育工作,江蘇、浙江等地建立了數據產業發展基金。北京海淀區、杭州高新區、廣東深圳前海等地探索建立面向數據產業的專業服務平臺和載體。在各方積極探索下,一大批創新型數據企業競相涌現,數據產業高質量發展的畫卷正徐徐展開。
接下來,國家數據局將多措并舉,進一步優化產業規劃布局,推動數據產業從“單點突破”向“全域發展”轉變。下半年,還計劃布局建設一批數據產業集聚區試點,支持和引導有條件的地區,立足資源稟賦和產業基礎,打造協同互補、特色鮮明、優勢突出、具有較強競爭力和示范帶動性的數據產業集聚區,發揮產業區域集聚和規模效應,探索多元化數據產業培育發展路徑。
據悉,由國家數據局主辦、貴州省人民政府承辦的2025中國國際大數據產業博覽會將于8月28日至30日在貴州省貴陽市舉行。本屆數博會將以“數聚產業動能 智啟發展新篇”為主題,圍繞“數據要素”“數據產業”“數字經濟”“數據基礎設施”“國際合作”5個板塊,舉辦20余場交流活動,分享數據產業前沿理論和創新實踐?!。ㄗ髡撸禾K德悅)
