Don't Miss
AI「炒散」|AI模型接編程散工 獨立開發力遜人類
By 信報財經新聞 on February 20, 2025
原文刊於信報財經新聞「EJ Tech 創科鬥室」
美企OpenAI周二(18日)公布測試基準SWE-Lancer,以評估人工智能(AI)模型在處理現實編程散工時的表現。團隊從自由工作平台Upwork,收集了1488份軟件工程任務,其報酬總計約100萬美元(約780萬港元),按照工作性質分為獨立貢獻與管理兩類,再交付不同AI模型處理。
研究發現,AI處理上述工作能力有限,表現最佳的Anthropic Claude 3.5 Sonnet,只能完成約四分一獨立貢獻,以及不足一半管理任務,合計約賺取40萬美元。
有關成果說明,AI模型目前在審查決策具優勢,惟獨立開發方面未及人類工程師,業界未來可循此方向思考如何安排人機分工。
Fiverr推自訓模型惹爭議
另一知名工作外包平台Fiverr昨推出AI服務Fiverr Go,讓創作者根據自己設計的作品,訓練自我專屬AI模型,再用該模型應付接單工作。Fiverr創辦人兼行政總裁考夫曼(Micha Kaufman )稱:「這不僅僅是另一個AI平台──這是對AI及人類創造力,如何協同工作的根本性重新構想。」
部分用戶不認同有關做法,覺得Fiverr Go就像要求他們,親手培養出取代自己的AI。有人更懷疑平台的做法,違背聯繫人類創作者與企業的初衷,並憂慮相關數據會被挪用到其他用途上,例如訓練其他更大規模AI模型,因此呼籲杯葛使用。
支持EJ Tech

