社交媒體和網頁抓取 (方保僑)
近期多家大型社交媒體先後發生了用戶資料外洩事件,繼Facebook於2019年被黑客盜取逾5億名客戶資料後,早前跨國求職網站LinkedIn亦爆出大規模用戶數據外洩,約5億名用家的姓名、電郵、電話號碼等資料被竊;語音社交平台Clubhouse的130萬名客戶資料被上載到一個黑客論壇。
不過,上述幾間科技企業均異口同聲否認旗下網絡系統遭黑客攻陷,且強調沒有洩漏賬號密碼或信用卡資料等,那麼,黑客究竟從何取得相關的用戶資料呢?
社交媒體本來就是一個讓朋友經由網絡互相認識的平台,因此在大家開始使用之際,往往會先把一些個人基本資料放到社交媒體上,不僅可以讓公眾瀏覽,最主要目的是讓朋友有機會藉不同條件與你取得聯繫。
昔日黑客活動還沒有那麼頻繁的時候,網民會隨便把個人資料,除真實名字外,其餘包括性別、電話號碼、電郵地址、出生日期等,全放到社交媒體的個人檔案供別人索閱。事實上,只要用搜尋引擎查找一下,往往能尋出朋友在社交媒體上的賬號或一些公開資訊;而黑客正是運用類似技術來進行「網頁抓取」(web scraping)活動,即是透過「網頁爬蟲」(web crawler)從網絡大量抓取不同用戶的資料,然後結集成一個巨大的資料庫。當大家看到社交媒體外洩的個人資料居然數以億計,就應明白不能小覷網頁抓取的能耐。
儘管個別社交媒體否認網頁抓取是漏洞,並強調客戶資料未有遭黑客盜取;不過,也有社交媒體因應事件作出補救修正。至於社交網用戶可以做的事,除了更改密碼和加設「雙重認證」登入,更關鍵是須改變社交媒體上個人賬號內的私隱設定,譬如把一些沒有需要公開的資料隱藏甚至刪除,包括出生日期、電話號碼或電郵等,避免這些資料無遮掩地暴露在互聯網上,讓黑客能隨意抓取並利用該些資料來攻擊你的互聯網賬號,以至盜取其他程式或電子郵箱等,令你蒙受更大損失,釀成「二次傷害」。
更多方保僑文章:
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。