Don't Miss
Microsoft報告|AI模型編程須靠偵錯器減失誤
By 信報財經新聞 on April 14, 2025
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」
美國科技巨擘微軟(Microsoft)近日發表研究報告,指出目前坊間的人工智能(AI)大型語言模型(LLM),在程式碼偵錯方面表現失準,無法有效解決多數編程錯誤問題。即使在專門偵錯器等工具協助下,提詞式的AI編程代理,問題解決率仍僅得一半左右。
問題解決率僅提高一半
微軟指出,LLM表現欠佳的主因,在於模型未有多學習「序列決策過程」(Sequential decision-making Processes)資料,欠缺可模擬人類逐步偵錯邏輯的訓練樣本。為解決此限制,微軟推出開源工具debug-gym,旨在讓AI代理能模擬人類開發者操作方式,主動進行互動式偵錯。
研究團隊為此測試了市面上9個LLM,包括OpenAI、Anthropic、Meta等。在其中一項測試中,3間科企模型解決編碼問題的成功率,最高分別有19.1%、37.2%與2.4%。其後,再配合偵錯器幫助,成績只能提高至30.8%、52.1%及4.8%。
儘管近月「氛圍編程」(Vibe Coding)概念盛行,AI代理被指可能會取代傳統編程員,但也有愈來愈多的科技領袖提出質疑。微軟共同創辦人比爾蓋茨(Bill Gates)為其中之一,其餘像國際商業機器(IBM)行政總裁克里希納(Arvind Krishna)等,都表達過相似看法。
支持EJ Tech

