大數據和隱私(杜志挺)
科技和互聯網快速發展,數據被大量產生和儲存,發展了近年來大熱門的大數據顯學,企業和社會對此充滿期待,但有些現象值得我們注意:
1.數據會帶來歧視,因為大量收集來的資料需要被整理分類,分類就會有同類或不同類的問題,也就會有主流或非主流的差異。一些被歸為非主流或不同類的人、事,難免受到歧視和壓力,允許非主流思想或族群生存和發展非常重要,因為人類的文明往往受到非主流思想牽引。
2.公開的資料可能受到誤用。例如,警察報告可能被罪犯拿來分析警員的巡邏時間、路線和人力分配。
富人付費買寧靜
3.人類有沒有被遺忘的權力?「凡走過必留下痕跡」這是早年Google辨論搜尋結果的說法,因為「凡走過必留下痕跡」,所以如果不想被搜尋到,就不要作儍事,因此Google有權提供所有找尋得到的資料;反過來說,一個人或一件事,如果不想被別人知道的話,就需要付出額外的代價:例如為了不公開資料便要付費。每個人年輕時可能都作過一些儍事,多年後這些儍事可否被遺忘?有些人可能犯了些少錯,改正後多年可否被原諒和遺忘(forgive and forget)?
4.人們想要不受干擾的需要愈來愈難被滿足,不只是有錢人不想被干擾,許多平凡人並不喜歡在Facebook或WhatsApp出現。大數據發達後,可能變成只有有錢人可以付費買到寧靜;或者一個普通人可能因為拒絕提供資料,變得什麼服務都享受不到,寸步難行。
作決定時有顧慮
5.有些人必須作一些不受歡迎的決定,例如法官、老師、警察、評審等。在大數據年代對這些人的保護可能不夠.因為愈發達的大數據應用,愈有辦法間接的找出關連,結果可能使這些決策者作決定時更有顧慮,最後傷害決策品質。
6.大數據會分析和預測個人的行為、偏好。這類分析通常透過分類方法(Classification),可是分類的結果並未能得到雙方同意,被錯誤分類的一方將更難得以申訴,最後是權力更往強者一方傾斜。例如,從前申請信用卡,被拒絕的話可以申訴,因為信用資料庫是根據申請人過往資料建立,如果有錯可以更正。但是在大數據年代,銀行所參考的可能包括所謂大數據分析,過度信任這類的分類結果,申訴成功的可能性就變得非常低。
7.大量而免費的資料並不一定代表正確。例如,媒體大量報道某人可能涉及一個惹人注目的事件,而且根據一些高曝光率的意見領袖說法,這個人一定涉及這件事,結果幾年後,法庭判決此人無罪,但大數據所塑造的輿論判決已經無法平反。
或強化羊群效應
8.大數據可能強化羊群效應。當所有人都能免費得取數據,從眾的心態可能更嚴重,特別是反應時間短的事件,例如塞車問題,大眾傾向跟從意見領袖,結果大數據分析扮演了意見領袖,所有人都跟着走,最後被指塞車的路沒塞車,備用的道路反而塞滿了車,類似的現象也在股市出現。
9.掌握資料者(例如一些互聯網公司)可能比你的朋友還了解你。所以當這類公司打算操縱資料時,可能沒有人可以阻止。例如,公司為簡化作業將客戶粗略分為幾類,有些人就會被分到自己不贊同的類別,或是公司為了操作容易,修改了客戶的消費數字,以至所收到的產品和服務與自己原來喜愛的大大不同。例如,當你的朋友看到Netflix推薦你的電影類別,可能會認為你有某種消費傾向,雖然你並不同意自己有這種消費傾向,但你朋友對你的認識已經被改動了。
如果沒有適當的規範,大數據的發展不見得會增加人與人之間的信任與了解。而信任與了解,卻是商業社會運作的基石,當社會和企業都熱中於大數據的發展,政府和各類機構應趕快建立規範。
更多杜志挺文章:
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。