港產平台代客蒐集數據 用戶效勞取樣省時 供企業訓練AI
原文刊於信報財經新聞「StartupBeat創科鬥室」

黃偉俊(左)及龍羽騫(右)表示,企業把蒐集數據工作外判予Datax用戶,不但可省時,更可確保取樣多元化。(黃潤根攝)
要發展人工智能(AI),掌握數據是首要條件。由5名香港大學畢業生成立的初創Datax(集智坊),就專攻數據蒐集這一環,先從全球招攬數據貢獻者,協助AI系統開發者蒐集所需的數據,提升AI系統的訓練效率。Datax創辦人及行政總裁黃偉俊,以及專責技術開發的龍羽騫受訪時表示:「我們協助企業、系統開發人員等,把需要大量動員及時間完成的數據蒐集工作,分派予我們的用戶去完成。簡單來說,Datax是一個中介平台,把開發AI系統的數據蒐集者,以及貢獻數據的Datax用戶連接起來。」
Datax使用者完成任務賺外快
二人以廣告公司作例子:廣告公司從外間收集幾千張海報影像後,連同一些用以蒐集數據的問題和任務上傳至Datax平台,平台就可按其需要及目標客群等,自動分發任務予合適的註冊用戶;用戶可利用Datax手機應用程式完成任務。常見任務包括:在手機屏幕標示海報上的品牌標誌或圈出用戶認為廣告內最牽動情緒的字眼、最矚目的地方等。這些任務旨在找出品牌標誌通常放於海報什麼位置、最吸引消費者的廣告元素是什麼等,並以這些數據訓練AI,從而建立廣告自動生成系統。
此外,對專門研發語音轉文字(Speech to Text)的AI系統,或語音控制家電的科企而言,經由Datax用戶在App錄下指令語句,可建立用來訓練AI系統的語音數據庫。
龍羽騫補充:「如果單單由公司內部團隊錄取語音指令,蒐集到的數據就很有限。」
相比由企業內部程式員花數星期時間自行研發系統或組織Focus Group蒐集數據,企業把蒐集數據工作外判予Datax用戶,可令蒐集數據的時間縮短至三數天,效率大大提升之餘,又可確保取樣多元化,有助客觀、宏觀地訓練AI。

Datax用戶可在手機程式錄下語句,協助數據蒐集者建立語音數據庫。(黃潤根攝)
至於蒐集到的數據,可經由後台系統瀏覽,甚至導出至自家系統,方便後期處理。Datax用戶則可透過貢獻數據賺取外快或者超市、網店禮券等。
Datax計劃的意念早於2017年便萌生,當時仍在港大修讀資訊系統及計算機科學學士的黃偉俊,正參與校內一項有關利用AI預示未來時尚趨勢的研究,需要從大量時尚KOL的社交媒體專頁獲取數據,他坦言:「問題是,所謂數據來源,其實都是一張又一張的圖片。」
結果,他要用人手記錄幾萬張圖片中,KOL穿的是什麼類型和顏色的衣服,「這些工作涉及的不過是簡單的Human Judgment,只要找大量空閒的人承包就能完成。」
上述經歷驅使黃偉俊、龍羽騫等5位同系同學開發Datax平台,只是由於當時要兼顧學業,平台要到今年4月才正式推出,至今約有8間公司使用過其服務。黃偉俊指出,客戶一般只要求蒐集約100至200名用戶的數據,目標不難達成,至今未有數據貢獻者不足的情況出現。
Datax現有700名註冊用戶,比例以大學生居多,本地人約有200名,其餘遍及台灣、美國、印度等地區。黃偉俊承認,不論從數目或年齡分布來看,目前規模仍未能完全滿足需求,有必要壯大用戶團隊,「更重要的是客戶,他們提出的蒐集數據任務本身如果有趣及有意義,會較容易吸引用戶。」

蒐集到的數據,可經由後台系統瀏覽,以及導出至自家系統。(受訪者提供)
參賽學懂先打穩陣腳
團隊現時在港大創新及創業中心iDendron的共享工作間辦公,資金來源除了客戶的服務費,亦來自港大「大學科技初創企業資助計劃」(TSSSU@HKU)、數碼港創意微型基金(CCMF)、香港科技園「Incu-Tech計劃」等,惟目前未有投資者注資。
此外,團隊時常參加不同創業比賽,曾於微軟2018年舉辦的全球大學生創新比賽潛能創意盃(Imagine Cup)「The Big Idea Challenge」賽事奪得第二名。
二人直言,參加創業比賽獲益良多,「(評判及風險投資者)時常問我們,如果亞馬遜之類的科技巨企投放資源,開發跟Datax類似的平台,我們可以如何招架?」黃偉俊表示:「我們應該在本土以至亞洲打穩陣腳,就算大型科企要涉足這類業務並揮軍亞洲,我們將會是它們的收購對象。」
採訪、撰文:陳子健
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。
Related Posts
Latest News
-
AI趨勢|OpenAI多地推AI代理工具Operator
聊天機械人ChatGPT開發商OpenAI在社交平台發文表示,正在向澳洲、巴西、加拿大、印度、日本、新加坡、南韓、英國等地的ChatGPT Pro用戶推出人工智能(AI)代理工具「Operator」,可以代表用戶執行任務。
- Posted February 21, 2025
- 0
-
AI大戰丨OpenAI擬下周推GPT-4.5 GPT-5或5月登場
美國傳媒報道,OpenAI將最快下周公布其最新人工智能(AI)模型GPT-4.5,而GPT-5則有望於5月下旬發布。更新後的GPT-5將對ChatGPT的使用方式進行重大改進,統一OpenAI的o系列和GPT系列模型,減少使用者選擇模型的困惑。
- Posted February 21, 2025
- 0
-
AI Pin|襟章策略失利 新星初創被HP收購
美國科技巨企惠普(HP)擬斥資1.16億美元(約9億港元),收購當地初創Humane大部分股權,接收對方多數員工、人工智能(AI)平台Cosmos,以及超過300項專利權,有關交易預計本月底完成。
- Posted February 21, 2025
- 0
-
全新視角觀賞熊貓寶寶生活(林國誠)
「熊貓TV」正式進入第二階段,新增設置於「大熊貓之旅」的6支鏡頭並引入多項嶄新功能,讓市民能以全新視角、多角度、更自由的方式觀賞「盈盈」、「樂樂」,以及牠們的龍鳳胎寶寶「家姐」與「細佬」的生活點滴。隨着這些升級功能的推出,熊貓熱潮勢必再掀高潮!
- Posted February 21, 2025
- 0
-
進軍電玩界|微軟推Muse動作模型 生成式AI闖遊戲開發
利用生成式人工智能(Generative AI),有助改革創新工業發展。微軟(Microsoft)研究團隊介紹一款名為Muse的「世界及人類動作模型」(WHAM),有關成果由微軟研究院旗下「遊戲智能」、「可教學AI體驗」兩組人員,跟英國劍橋遊戲開發工作室Ninja Theory合作完成。
- Posted February 21, 2025
- 0
-
理大夥中移香港拓6G應用
香港理工大學與中國移動(香港)創新研究院達成合作協議,並簽署合作備忘錄及合作項目協議。校長滕錦光(後排左二)稱,今次合作充分發揮學術界與業界的協同優勢,雙方將聚焦戰略性的科技領域,包括人工智能(AI)、6G及Web3等範疇的技術革新及應用。
- Posted February 21, 2025
- 0
-
Apple新機|iPhone 16e今預訂 入門版售5099元
Apple 發布最新款智能手機iPhone 16e,搭載最新一代A18晶片及4核心圖像處理器(GPU),可流暢運行Apple Intelligence,例如AI寫作工具、Genmoji、Image Playground等人工智能(AI)功能。
- Posted February 21, 2025
- 0
EJ Tech Video
POPULAR POSTS
-
Grok 3|馬斯克「最醒」AI模型登場 Grok 3香港可用 月費170元
-
點語成丹青|港首辦成語變畫作AI比賽 120間中小學參與 收逾千作品
-
EzyGreenPak|環保袋減廢遇熱水即溶 港EzyGreenPak專利 今屆渣馬採用
-
EzyGreenPak|自家平台監控碳排 助家族工廠轉型
-
DeepSeek|據報新增互聯網訊息服務
-
AI大戰|馬斯克聊天機械人Grok 3亮相 稱性能勝DeepSeek
-
神經元記錄|哈佛研CMOS矽晶片 記錄神經細胞活動
-
X危機?|馬斯克旗下X傳以3432億估值洽融資
-
AI「炒散」|AI模型接編程散工 獨立開發力遜人類
-
AI研究院|理大成立「人工智能+研究院」