Don't Miss

Microsoft報告｜AI模型編程須靠偵錯器減失誤

By 信報財經新聞 on April 14, 2025

原文刊於信報財經新聞「CEO AI⎹ EJ Tech」

美國科技巨擘微軟（Microsoft）近日發表研究報告，指出目前坊間的人工智能（AI）大型語言模型（LLM），在程式碼偵錯方面表現失準，無法有效解決多數編程錯誤問題。即使在專門偵錯器等工具協助下，提詞式的AI編程代理，問題解決率仍僅得一半左右。

微軟近日發表研究報告，指出目前坊間的AI大型語言模型無法有效解決多數編程錯誤問題。（路途資料圖片）

問題解決率僅提高一半

微軟指出，LLM表現欠佳的主因，在於模型未有多學習「序列決策過程」（Sequential decision-making Processes）資料，欠缺可模擬人類逐步偵錯邏輯的訓練樣本。為解決此限制，微軟推出開源工具debug-gym，旨在讓AI代理能模擬人類開發者操作方式，主動進行互動式偵錯。

研究團隊為此測試了市面上9個LLM，包括OpenAI、Anthropic、Meta等。在其中一項測試中，3間科企模型解決編碼問題的成功率，最高分別有19.1%、37.2%與2.4%。其後，再配合偵錯器幫助，成績只能提高至30.8%、52.1%及4.8%。

儘管近月「氛圍編程」（Vibe Coding）概念盛行，AI代理被指可能會取代傳統編程員，但也有愈來愈多的科技領袖提出質疑。微軟共同創辦人比爾蓋茨（Bill Gates）為其中之一，其餘像國際商業機器（IBM）行政總裁克里希納（Arvind Krishna）等，都表達過相似看法。

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI LLM Microsoft 氛圍編程

Tweet

Pin It

Related Posts

青春期與情緒反思的力量（黃岳永）

青春期與情緒反思的力量（黃岳永）

Waymo｜自駕的士貼便條招IT人

Waymo｜自駕的士貼便條招IT人

本地創科動態｜日內瓦發明展科大奪38獎

本地創科動態｜日內瓦發明展科大奪38獎

OpenAI｜增驗證確保AI安全使用

OpenAI｜增驗證確保AI安全使用

Latest News

Meta壟斷案｜正式開審朱克伯格作供
Facebook(fb)，WhatsApp 和Instagram(Ig)的母公司Meta行政總裁朱克伯格(Mark Zuckerberg)，周一就美國反壟斷機構聯邦貿易委員會(FTC)控告Meta違反壟斷法的案件首日上庭作供，反駁有關指控。

Posted April 15, 2025

0

青春期與情緒反思的力量（黃岳永）
影視串流平台Netflix迷你劇《混沌少年時》（Adolescence）一上架便成為全球最熱門影集榜首，能夠迅速引起廣泛討論，皆因故事夠「貼地」。

Posted April 15, 2025

0

Waymo｜自駕的士貼便條招IT人
在美國三藩市、洛杉磯、奧斯汀等科技中心，Waymo自駕的士隨處可見。美國《華盛頓郵報》報道，一些人回歸到最基本的途徑，例如在的士上留下手寫便條。

Posted April 15, 2025

0

本地創科動態｜日內瓦發明展科大奪38獎
第50屆瑞士日內瓦「國際發明展」周日（13日）閉幕，今年共吸引來自約35個國家及地區的發明家、大學、機構及公司，提交近1050項發明，當中299項來自香港。

Posted April 15, 2025

0

OpenAI｜增驗證確保AI安全使用
ChatGPT開發商OpenAI近日發布支援頁面，意味着可能很快就會要求機構在完成身份驗證流程後，才可以存取某些未來的人工智能（AI）模型。

Posted April 15, 2025

0

GitHub｜誤封中國斷網19小時
全球知名代碼託管平台GitHub，剛過去的周末發生一宗技術故障，導致中國大陸地區用戶，無法存取該網站與相關功能，此一問題共歷時約19小時。

Posted April 15, 2025

0

貿易通｜AI偵破深偽準確率98% 圖像影片換臉變聲無所遁形
在香港國際創科展（InnoEX）設有攤位的貿易通（00536），開發先進的深偽（Deepfake）偵測技術，以檢測由AI生成及操縱的圖像、影片和音頻，識破騙徒換臉及變聲等詐騙手段，聲稱準確率高達98%。

Posted April 15, 2025

0

POPULAR POSTS

搶人才｜Google一年有薪假阻AI專才跳槽

 Monica｜新平台Monica玩盡多款AI模型

 AI時代｜IBM z17主機運算量增五成

 Shopify｜要求盡用AI節省人手

 OpenAI｜協助產業建專屬模型

 AI魔法時代降臨（林國誠）

吉卜力漫畫化掀版權爭議（方保僑）

貿易通｜AI偵破深偽準確率98% 圖像影片換臉變聲無所遁形

 Meta壟斷案｜正式開審朱克伯格作供

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe