互聯網已改變了經濟運行、政府運作以及人類生活的方式。一個新的、不太顯眼的科技趨勢同樣具有巨大的變革能力,它就是“大數據”(Big Data)。
“大數據”發軔于以下這個事實:當下涌現的信息比以往任何時候都要多得多,而且,這一趨勢正在應用于多個層面。盡管互聯網使得“大數據”更易收集并進行共享,但“大數據”與互聯網迥乎不同。“大數據”不僅僅是信息交流,人們從海量信息中學到的東西,在少量信息中往往無法獲取。
公元前3世紀,埃及的亞歷山大圖書館被認為收藏了人類的所有知識。而如果把今天全世界的信息平分給活著的每個人,每人獲得的信息量將是當年亞歷山大圖書館藏書量的320倍。現在全球的信息量大概為1200艾字節——如果把這些信息存儲到光盤,這些光盤將會堆成5摞,每摞都可一直堆到月球。
這種數據爆炸現象,是近年來才出現的。2000年,全球所有的存儲信息中只有1/4經過數字化,剩下的保存在紙張、膠片和其他介質上。但由于數字化數據膨脹如此之快,眼下,在所有存儲信息中只有2%是非數字化的。
“大數據”的一個特征是,它能將世界的多個層面用數據來表述(即“數據化”)。例如,位置信息的數據化,最近通過GPS衛星系統實現。當電腦“挖掘”數世紀內的書籍時,文字便被視為數據。甚至連友情和愛好也通過臉譜網而被數據化了。借助于電腦內存、高性能處理器、智能算法、聰明軟件,這類數據正在被廣泛應用于多個層面。
要利用“大數據”,人們需要在3個層面做出改變。第一是收集和使用大量數據,而非像一個多世紀以前統計學家那樣,囿于少量數據或樣本。第二是拋棄我們對條分縷析的數據的偏好,轉而接受紛繁蕪雜的數據。第三,在許多場合,我們需要放棄窮原竟委,而是了解事件之間的相關性。研究人員可收集和分析大量有關某個事件的信息及所有相關素材,探究有助于預測未來事件的規律。大數據有助于回答“是什么”、而非“為什么”的問題。
倘若假以時日,大數據可改變我們思考世界的方式:不再試圖了解世界運轉背后的深層原因,只需弄清現象間的聯系并用這些信息解決問題即可。