Don't Miss
Anthropic|冀破解AI內部運作
By 信報財經新聞 on April 28, 2025
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
美國科企Anthropic聯席創辦人及行政總裁阿莫迪(Dario Amodei)發表文章指出,人工智能(AI)技術勢不可擋,惟可解釋性(Interpretability)才是業界與政策制定者應該關注的焦點。他宣稱,要搶先發展出類似磁力共振掃描(MRI)的工具,以破解其可解釋性,才能真正為AI發展掌舵。
研發新工具 料兩年內面世
人類雖能夠讀懂傳統軟件代碼,但生成式AI內部機制卻有如「黑盒」,我們只能看到輸出結果,卻無法理解其生成、取捨原因。阿莫迪認為,這種機制帶來無法預測的風險,模型可能出現欺騙、尋權(Power-seeking)與錯誤行為,也增加濫用、越獄與合規障礙。
阿莫迪在文章寫到:「我們一直在努力解決這個問題,試圖創造一種類似高精度磁力共振的工具,能完整揭示AI模型的內部運作。」Anthropic目前已做到利用「電路」(Circuits)概念,描繪AI模型思考步驟。
他預期,未來一兩年就會出現「數據中心的天才國度」,屆時這些系統會掌控經濟、科技與國家安全,而且將具備高度自主性,因此人類不能對其運作毫無理解。Anthropic計劃於2027年前,達致利用可解釋性工具,檢測多數AI模型問題,並將專門為此投資新創公司。
支持EJ Tech

