8月23日-24日,晉陽湖·數字經濟發展峰會第二屆云岡數字新基建發展論壇在大同舉行。本屆論壇由中共大同市委、大同市人民政府、山西省工業和信息化廳共同主辦,國家工業信息安全發展研究中心(以下簡稱“中心”)、中國電子商會呼叫中心與客戶關系管理專業委員會、鼎韜產業研究院、大同市數字政府服務中心等共同承辦。
會上,中心正式發布《2023人工智能基礎數據服務產業發展白皮書》。海天瑞聲作為人工智能基礎數據領域領軍企業再度受邀參與編寫,同時,受中心和大同市政府邀請,參加專題閉門會議,為人工智能基礎數據創新發展和大同市人工智能產業發展獻計獻策。
海天瑞聲參編 《2023人工智能基礎數據服務產業發展白皮書》
白皮書梳理了人工智能基礎數據服務的概念內涵,介紹了大模型不斷突破下產業發展面臨的新背景和具備的現實意義,系統分析了產業的發展現狀、發展環境和典型服務場景,詳細探究了產業未來發展趨勢及面臨的挑戰,并提出了相應的舉措建議,旨在為各界展現我國人工智能基礎數據服務產業發展全貌,為產業發展提供新思路。
《2022人工智能基礎數據服務產業發展白皮書》重磅發布
白皮書指出,人工智能基礎數據服務產業是人工智能產業的重要支撐,為人工智能提供重要的數據“燃料”。隨著人工智能技術的日益成熟和普及,特別是近年來基于大模型的生成式人工智能技術不斷取得的突破,高質量數據需求保持了迅猛增長態勢。發展人工智能基礎數據服務產業能夠助力構建人工智能產業生態,廣泛促進就業,帶動地方商業經濟快速發展,具備良好的產業生態效應及經濟社會效益。在全球人工智能產業保持高速增長的態勢下,人工智能基礎數據服務產業已進入技術創新密集活躍、產品應用深度拓展的發展機遇期。
白皮書認為,生成式大模型等顛覆技術的發展和衍生應用背景下,人工智能基礎數據服務產業規模快速增長,并逐步進入到注重技術能力的專業化發展階段。產業鏈日趨完善,呈現百家爭鳴的競爭態勢,中小型數據商同質競爭激烈,品牌數據服務商技術、人才優勢明顯。同時,大模型的快速發展使得數據服務需求激增,產品整體處于供不應求狀態。對話式數據集成為當下需求熱點,定制化服務占據市場需求主流。企業間競爭正由價格渠道競爭,向包括技術、管理、資金在內的綜合能力競爭轉變,行業門檻提高。互聯網科技巨頭和專業品牌數據服務商占據市場競爭優勢,中小型數據服務商的利潤空間被進一步擠壓,市場出清加速。從場景布局來看,自動駕駛是當前最重要數據服務場景。從區域布局來看,產業基地集中于山西、山東等人口大省,產業研發中心則在北京、上海等一線城市聚集,呈現分化集中的特點。
當前,我國人工智能基礎數據服務產業的發展環境持續向好,產業政策逐步完善,行業技術水平不斷提升,人才發展生態持續優化,標準建設布局明顯加快,資本市場日趨活躍。在不斷優化的產業發展環境下,人工智能基礎數據服務產業發展呈現以下發展趨勢:一是高質量數據集將成為重要發展方向,國內優質數據集仍然較為稀缺,專業化、高質量數據集建設亟待加強。二是合成數據將在大模型帶動下成為產業發展新賽道。受多樣化不足和長尾化效應影響,大模型訓練數據面臨耗盡的問題。算法生成的合成數據有望彌補不足,成為數據服務新賽道。三是大模型將助力智能化服務模式快速落地,有力提升數據服務效率。四是數據服務人才將加速向高端化發展,復合化、專業化人才將成為行業主力。五是數據合規、隱私保護、價值觀對齊等安全問題將進一步成為產業關注重點。
白皮書提出,目前我國人工智能基礎數據服務產業在快速發展同時,也面臨著人才培養不足、標準體系亟待健全、數據安全風險凸顯等挑戰,需要從技術、產品、標準、人才、安全、公共基礎設施等方面著手,進一步推動我國人工智能基礎數據服務產業持續健康發展。一是加快構建高質量數據集。二是研發數據服務質量評測標準。三是加強技術研發,發揮集約化、自動化數據服務工具優勢。四是提升專業人才供給,帶動勞動密集型業態轉型升級。五是加大行業安全監管,優化數據服務安全環境。六是完善公共基礎服務,健全產業支撐體系,營造互利共生、協同共進的產業生態。
數據“燃料”助推人工智能領域創新發展
會議期間,大同市政府召開了與數據服務企業的閉門對接會議。大同市人民政府副市長孟維君,市政府副秘書長、市數字政府服務中心主任韓杰與國家工業信息安全發展研究中心人工智能所副所長劉永東及海天瑞聲、文遠知行、企商在線、北京萬方、同方知網、東湖大數據交易中心等參會企業負責人,圍繞大同數據標注產業發展定位及方向、人工智能大模型如何助力大同數據標注產業鏈發展兩個議題進行深入交流,為大同數字經濟發展分享思路觀點,也為今后地企密切合作建言獻策。
海天瑞聲作為基礎數據服務行業的龍頭企業,將發揮領軍企業作用,為進一步推動數字新基建賦能大同數字經濟發展,添磚加瓦、貢獻力量。