大數據,正成為當今世界最炙手可熱的產業(yè),企業(yè)、政府紛紛對其趨之若鶩。然而我市一些業(yè)內人士表示,盡管大數據前景被普遍看好,但發(fā)展上也不能操之過急,只有翻過數據來源、成果應用和隱私保護這“三座山”,大數據產業(yè)才能有光明未來。
數據“山”:海量數據是基礎
顧名思義,大數據的首要特點就是“大”,沒有大,一切都無從談起。專家預測到2020年,全球每年新創(chuàng)的數據容量將會達到40澤字節(jié),如果要用DVD光盤儲存一天在互聯網里傳送的數據的話,大約需要2.5億張光盤。
東北財經大學教師屈超說,大數據取得成功的前提是有足夠多的樣本供應,“小數據”時代的分析預測采用的是隨機樣本分析的方法,弊端就在于一旦采樣過程存在偏見,分析結果就會相去甚遠;而大數據“樣本=總體”的分析方法,讓產生誤差的概率大大縮小。
業(yè)內人士建議:我市要發(fā)展大數據產業(yè),首先就要解決海量數據來源的問題,在企業(yè)短期內無法搭建擁有足夠訪問量平臺的情況下,可由政府牽頭在公共服務領域搭建一個信息共享平臺,為大數據的發(fā)展提供充足的數據樣本。
應用“山”:有應用才有價值
大連天維科技總經理李丕說,我市發(fā)展大數據產業(yè),一定要先期、至少要同步解決好需求、應用的問題,否則可能陷入高投入、低產出的窘境。李丕認為,阿里巴巴集團之所以近年在大數據業(yè)務上發(fā)展迅速,并已經將其作為未來集團三大戰(zhàn)略方向之一,正是因為其背后有強勁的應用需求和驅動。
專家建議:我市一定要提前找準和確定幾個確切的應用方向和領域,之后再加快大數據產業(yè)本身所需的基礎設施、技術等方面的投入。要讓市場牽著產業(yè)發(fā)展,讓效益支撐技術進步,不能不計產出地盲目投入。
隱私“山”:法律邊界要先厘清
今天的互聯網領域,隱私安全已經越來越成為一個問題。大數據帶來的不僅是各種便利及機會,同樣也會讓人們時刻都暴露在“第三只眼”之下。專家表示,跨不過“隱私山”,大數據的前途注定會非常坎坷。
中科院大連化物所研究人員李國輝說,數據的采集必然包括客戶的性別、年齡、辦公地址、家庭住址、消費能力水平、消費偏好等內容,甚至還包括客戶的消費行為特點等詳細的信息,通過對這些信息進行分析從而洞察客戶的需求和意向。而問題在于,上述信息對客戶來說可能屬于個人隱私,客戶可以接受這些信息存在于本次交易過程中,而不一定接受信息“被存儲”、“被分析”,甚至“被營銷”。李國輝認為,這種狀況持續(xù)下去必然會遭遇反彈,如減少提供個人信息,或者提供虛假偽造信息等,這樣會造成大數據中冗余數據過多的情況,阻礙大數據的健康發(fā)展。
專家建議:我市發(fā)展大數據產業(yè),隱私安全和保護等法律問題必須厘清、完善,許多問題企業(yè)無力單獨解決,需要政府在其中發(fā)揮重要作用。