You are currently at: ejtech.hkej.com
Skip This Ads
Don't Miss

Anthropic|冀破解AI內部運作

By on April 28, 2025

原文刊於信報財經新聞「CEO AI⎹ EJ Tech

美國科企Anthropic聯席創辦人及行政總裁阿莫迪(Dario Amodei)發表文章指出,人工智能(AI)技術勢不可擋,惟可解釋性(Interpretability)才是業界與政策制定者應該關注的焦點。他宣稱,要搶先發展出類似磁力共振掃描(MRI)的工具,以破解其可解釋性,才能真正為AI發展掌舵。

研發新工具 料兩年內面世

人類雖能夠讀懂傳統軟件代碼,但生成式AI內部機制卻有如「黑盒」,我們只能看到輸出結果,卻無法理解其生成、取捨原因。阿莫迪認為,這種機制帶來無法預測的風險,模型可能出現欺騙、尋權(Power-seeking)與錯誤行為,也增加濫用、越獄與合規障礙。

阿莫迪在文章寫到:「我們一直在努力解決這個問題,試圖創造一種類似高精度磁力共振的工具,能完整揭示AI模型的內部運作。」Anthropic目前已做到利用「電路」(Circuits)概念,描繪AI模型思考步驟。

阿莫迪提到,Anthropic目前已能描繪AI模型的思考步驟。(維基百科網上圖片)

他預期,未來一兩年就會出現「數據中心的天才國度」,屆時這些系統會掌控經濟、科技與國家安全,而且將具備高度自主性,因此人類不能對其運作毫無理解。Anthropic計劃於2027年前,達致利用可解釋性工具,檢測多數AI模型問題,並將專門為此投資新創公司。

支持EJ Tech

如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們