數據產生無止境 (車品覺)
市場研究公司IDC預測,到了2025年,全球大數據規模將達到180個Zettabyte(180後面再跟21個零)。為消化如此多數據,企業正在加速構建強大的數據提煉設施。據《華爾街日報》報道,亞馬遜、谷歌和微軟三家企業去年在這方面的資本開支合計達到320億美元。另外,作為物聯網企業代表的Tesla截至去年底,已經收集到21億公里里程的駕駛數據。
數位經濟的核心也正在轉移到更動態的數據流程:社交關係的變化、所見所聞的視頻流,還有人們在生活中與各種智能設備主動或被動互動所生成的數據。因此愈來愈多的設備都在變成新的數據來源,互聯網與感測器將充斥世界,無論走到哪裏做着什麼,都會產生相應的數位腳印。
互聯網應用收集的行為數據,首先被用於改進定向廣告,成效卓著。這種數字力量雖還在初期階段,但已經見到有公司(如阿里和騰訊),正在加緊運用強大的應用程式(如淘寶、微信)去吸收大量的使用者行為數據,繼而使用數據所產生的know how(秘訣)去吸引更多用戶,進而又催生更多數據。他們正在建立具備強大網絡效應的數位經濟引擎,並發現這些數據還可以與其他人合作,而成為更大的生態圈及網絡。
智能手機變行車記錄儀
如果你以為,僅有大公司才可參與這個遊戲,你就大錯特錯了。以色列初創企業Nexar就設計了一種巧妙的方式,令司機成為數據來源。其應用把司機的智能手機變成行車記錄儀,通過司機的操作標記行車錄影。若很多人都在同一位置突然煞車,此處就可能存在坑洞或障礙物。作為使用Nexar應用的報酬,司機可獲得免費的行車記錄儀和相應服務,如一旦發生事故,就可有詳細報告。Nexar的目標是提供各類服務,進而有效地協助司機避免事故。數位經濟的成功重點在於有否use data to get data(用數據獲得更多數據)的能力。
不過,在人工智能或機器智能真正大行其道之前,另一種能力也變得愈加重要。由於不同類型的非結構化數據和多種格式的數據從感測器、網絡以及傳統數據庫大量湧入,令到數據整理變得更加困難。像提煉石油一樣,使用這些資源的前提是必須先對數據進行清理和組織。難怪行內有說:「數據治理的本質也需要人工智能去達到智能化,傳統的數據倉庫式開發過程已經無法處理每刻都在更新的多源異構數據。」這就好比二十世紀高速公路的建設是為了滿足現代經濟發展需求,大數據時代也需要相應的基建來支撐。
(編者按:車品覺最新著作《覺悟。大數據》現已發售,歡迎訂購實體書。)
更多車品覺文章:
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。