Don't Miss
Anthropic|新模型懂編程寫作
By 信報財經新聞 on February 26, 2025
原文刊於信報財經新聞「EJ Tech 創科鬥室」
當人類大腦運作時,有些疑難要深入思考,有些問題要快速回答。美國人工智能(AI)初創Anthropic推出市場首款混合推理模型Claude 3.7 Sonnet,可以生成12.8萬Tokens回應。除了「擴展思維」模擬推理(SR)能力外,更結合編碼、視覺及寫作技能,標榜為現時「最聰明」的模型,不但懂得識別及糾正自身錯誤,在內容生成、數據分析及規劃有顯著改進。
可選快速回應或顯示思路鏈
新模型可自選快速回應或顯示思路鏈,類似OpenAI旗下o1及o3系列、谷歌Gemini 2.0 Flash Thinking,以及內地DeepSeek-R1等AI模型。開發人員可在Claude網站、Claude應用程式、Anthropic API(應用程式介面)、亞馬遜AI平台Amazon Bedrock,以及Google Cloud旗下Vertex AI使用。API定價方面,100萬個Tokens輸入及輸出收費,分別為3美元(約23.4港元)及15美元(約117港元)。
Claude 3.7 Sonnet基準測試成績突出,針對現實世界軟件問題的SWE-bench Verified,以至評估AI代理複雜任務表現的TAU-bench,兩者均獲得業界最高評分,力壓OpenAI o1、o3-mini,以至DeepSeek-R1等主流模型。針對軟件開發人員,Anthropic還推出新「代理」工具Claude Code,可把程式碼推送到託管平台GitHub,一次對話節省約45分鐘人手操作時間。
支持EJ Tech

