大數據最大的價值在商業服務領域,商業通過大數據透視了用戶深層次的特征和無法顯見的內在需求。這與傳統的數據分析有相似性卻完全不同。傳統的數據分析更多的是因果關系的追溯,通過數據所呈現出來的趨勢了解某種行動所產生的某類結果。
與傳統數據分析的邏輯推理研究不同,大數據研究是對數量巨大的數據做統計性的搜索、比較、聚類和分類等分析歸納,因此繼承了統計科學的一些特點。統計學關注數據的相關性或稱關聯性,所謂“相關性”是指兩個或者兩個以上變量的取值之間存在某種規律性。“相關分析”的目的是找出數據集里隱藏的相互關系網(關聯網),一般用支持度、可信度和興趣度等參數反映相關性。兩個數據A和B有相關性,只反映A和B在去取值時相互有影響,并不能告訴我們有A就一定有B,或者反過來有B就一定有A。這種分析方法決定了大數據所分析的是全局數據,不需要太多的考量精度,通過對所有數據的分析就能洞察細微數據之間的相關性,從而提供指向型商業策略。
正因為大數據時代全局數據分析的的這種特質,讓用戶隱私保護幾乎是一個偽命題。互聯網時代我們都清楚我們在網絡上的一切行為都可以被服務方知曉,當我們瀏覽網頁、發微博、逛社交網站、網絡購物的時候,所有的一舉一動實際上都被系統監視著。就像亞馬遜監視著我們的購物習慣、谷歌監視著我們的網頁瀏覽習慣,Twitter了解我們的心中所好,FACEBOOK似乎什么都知道,包括我們的社交關系網。所有這些網絡服務都會通過對用戶洞察獲取商業利益,例如用戶在電商網站上購買了襯衫,相關的襯衫推薦就會在未來一段時間內推薦給用戶;用戶在社交網絡上提到某種產品或服務,這類型的產品或服務就能主動找到用戶。所有這種商業行為本質上就是機構通過對用戶隱私的洞察來獲取商業收益。
如果說互聯網時代人們的隱私受到了威脅,那么大數據時代無疑加深了這種威脅。如果不是大數據,這些服務方依然會對用戶的數據進行分析,但更多的是針對某個特定的數據來關聯服務。而大數據時代是完全不同的數據收集、分析方式是,是對用戶的全景洞察,通過對用戶所有數據的分析了解各因素之間的相關性。例如通過社會化網絡數據的全景分析,了解用戶在下一時段的購買傾向,甚至通過對所有用戶購物行為的分析,清楚的提煉到底那些用戶在未來一個月需要購買什么類型產品、需要多少數量。這種大數據的價值潛力,使得個人信息被更多采集、更久存儲、更徹底利用。甚至有些看似無關緊要的信息,關聯在一起就能精準定位到具體的某個人。
隨著互聯網逐漸成為人們生活的必需品甚至依賴品,而對于互聯網企業來說,不掌握用戶隱私對其來說是巨大的資源浪費和缺失。在大數據時代越來越多的互聯網企業開始意識到,掌握更多的用戶隱私,意味著更靠近成功的門口。互聯網的下一波競爭是隱私之戰,用戶的隱私就是它們的核心競爭力。只有掌握用戶在互聯網的一舉一動,才能實現對用戶的洞察,如果放棄對隱私的控制,對它們而言無異于釜底抽薪。在這種情況下,杜絕互聯網服務企業收集用戶隱私幾乎是不可能的。