代理式協作層|視覺應用前景俏
原文刊於信報財經新聞「CEO AI⎹ EJ Tech——智情筆報」
在人工智能(AI)領域,傳統技術堆疊(Stack)框架通常分為4個層級,最底層是基礎設施,包括運行AI模型所需的硬件及計算資源,如伺服器、雲端服務和邊緣設備。其上是數據層,負責數據的收集、儲存和管理。第三是模型層,進行AI模型的開發、訓練和優化。最頂端是應用層,直接透過應用程式和介面來跟用戶互動。以上各層相互協作,覆蓋從硬件資源到最終應用的全過程。
會審慎思考 反覆修正
不少專家認為,這套結構已浮現一個新的「代理式協作層」(Agentic Orchestration Layer),位於模型和應用這兩層之間,可以拆解問題、安排任務、串接工具。多間企業紛紛對此作出部署,上月美國軟件巨擘Adobe、甲骨文(Oracle)分別發布自家AI代理協作平台,惠普(HP)、Quali亦宣布,跟輝達(Nvidia)的軟件平台整合,以加強代理式AI生態。內地智譜最近開源的AutoGLM模型,以及Google新發布的Agent2Agent協議,都可歸入此層。
跟「代理式協作層」關係密切的領域,首推視覺AI。因牽涉圖像或影片的工作,本質上必然是多步推理、語境豐富,無法靠單次輸入或輸出完成。傳統AI模型或能有效辨識物件、分類畫面,可是面對現實複雜場景,例如在工地影片內找出安全措施不足、身處危險區域者,就需要拆解不同任務和連結時間線,並調用複數模型協作,這些正是代理式AI的強項。
視覺資料亦不同於表格數據,其內容都是雜亂、動態甚至模糊的,代理式架構讓AI先像人類一樣審慎思考執行方案,在必要時反覆修正,容許AI根據當下實際需求,選擇使用哪一套工具或模型,跳脫了個別靜態模型的局限。
港布局應用尚待改善
放眼香港,視覺AI已有一定程度應用。醫管局於2021年引入自行訓練的AI模型篩查肺部X光片,屋宇署去年透過AI分析無人機拍攝的大廈外牆照片;房委會也挑選了10條屋邨作為智慧屋邨管理試點,使用AI偵測閉路電視影片中的高空擲物事件。
不過,目前本地應用案例多數仍屬於公共機構導向或試點性質,並集中於單一任務或明確場景,尤其當局各單位似傾向各自建立、使用AI模型,欠缺分享數據或互動協作,忽略了AI協作的關鍵價值,在統一調度與跨域連結。若想讓不同部門的AI系統真正共同協作,港府須推動跨部門AI協作機制,否則擁有再多的數據或先進模型,AI也無法提升其治理效能。
支持EJ Tech

