AI之戰|OpenAI新功能 極速建分析報告
原文刊於信報財經新聞「EJ Tech 創科鬥室」
OpenAI繼推出最新推理模型o3-mini之後,再引進「深度研究」(deep research)功能,透過多步驟研究任務的代理,能夠找到、分析及綜合數百個網上資源,宣稱幾十分鐘就能完成人類幾個小時方能完成的工作。OpenAI指出,深度研究旨在於金融、科學、政策、工程等從事密集知識工作,以「研究分析師級別」建立報告。
「深度研究」模型表現勝DeepSeek
另一方面,美國人工智能(AI)科企Scale AI推出基準測試「人類終極考驗」(Humanity’s Last Exam),包含3000多道選擇題及簡答題,涵蓋語言學、火箭科學、古典文學到生態學等100多個學科。測試結果顯示,OpenAI支持深度研究的模型,以26.6%準確率創下新高,成績大幅領先DeepSeek-R1的9.4%【表】。
深度研究需大量算力支持,Pro版訂戶每月最多可查詢100次,Plus及Team用戶將稍後獲得存取權限,惟英國、瑞士及歐洲經濟區暫時不可用。OpenAI研究資深副總裁陳信翰(Mark Chen)稱:「我們最終願望是建立一個能夠自己發掘及發現新知識的模型。」他又說:「這是我們(通用人工智能)路線圖的核心。」
外媒The Information報道,OpenAI旗下聊天機械人ChatGPT訂戶數量在2024年增至接近1550萬,規模比前年同期580萬倍增。其他市場對手方面,微軟同樣為AI工具Copilot開放「Think Deeper」(深入思考)按鍵,讓用戶解決編程或數學問題。另一美企Perplexity近日為Pro版訂戶引入DeepSeek-R1推理功能,費用為每月20美元或每年200美元。