Don't Miss

AI玩瑪利歐｜主流AI模型玩瑪利歐 Claude 3.7表現摘冠

By EJ Tech on March 6, 2025

要評估人工智能（AI）模型性能，坊間有無數的基準測試，打機卻能考驗臨場反應。美國加州大學聖地牙哥分校研究機構Hao AI Lab最近嘗試以GamingAgent，透過Python程式碼操控《超級瑪利歐兄弟》，再比對各款AI推理模型的動作。

在《超級瑪利歐兄弟》遊戲世界，能否安全跳下或墜落身亡，把握時機就是一切。測試結果發現，Anthropic旗下Claude 3.7成績最好，其次是Claude 3.5。至於谷歌（Google）開發的Gemini 1.5 Pro，以及OpenAI GPT-4o表現較差。

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI Claude 3.7 Hao AI Lab 瑪利歐

Tweet

Pin It

Related Posts

數碼科技體驗館｜數碼港17間園區企業展成果

數碼科技體驗館｜數碼港17間園區企業展成果

嘲諷科技文化｜矽谷過路處按鈕被駭遭惡搞

嘲諷科技文化｜矽谷過路處按鈕被駭遭惡搞

AI代勞損信任｜哈佛教授提醒易遭識破損信任企業CEO與員工交流忌以AI代勞

AI代勞損信任｜哈佛教授提醒易遭識破損信任企業CEO與員工交流忌以AI代勞

提示工程五大趨勢（車品覺）

提示工程五大趨勢（車品覺）

Latest News

實踐可持續建築減廢方案（鄧淑明博士）
據發展局局長甯漢豪指出，近年香港的公營部門及私營公司，每年建築工程費用總開支達到3000億元，可為業界提供實踐可持續建築的黃金機會，把「ESG（環境、社會及管治）原則」納入大型建築項目，筆者深表認同。

Posted April 17, 2025

0

數碼科技體驗館｜數碼港17間園區企業展成果
數碼港「數碼科技體驗館」正式開幕，即日起向企業及公眾開放。當中設有「提升效率」、「安全」、「互動體驗區」三大展區，展示人工智能（AI）、區塊鏈及Web3.0等最新前沿科技方案，涵蓋教育、醫療、智慧城市等領域的應用。

Posted April 17, 2025

0

DeepMind｜聘專家安全開發AGI
科技巨企谷歌（Google）旗下人工智能（AI）研究團隊DeepMind，在英國倫敦公開招募「後AGI」研究科學家，研究通用人工智能（AGI）、超級人工智能（ASI）及機器意識，以至AGI對人類社會基礎的影響。

Posted April 17, 2025

0

離心砲｜美初創研建離心炮發射衞星
美國加州初創SpinLaunch主力研發巨型離心砲，計劃明年起發射數百顆微型衞星，在近地軌道（LEO）部署通訊系統Meridian Space。

Posted April 17, 2025

0

嘲諷科技文化｜矽谷過路處按鈕被駭遭惡搞
美國加州三藩市灣區等矽谷一帶，上周末起相繼有人發現行人過路處按鈕被駭，植入多條以人工智能（AI）合成的模仿語音，聲稱自己為Meta行政總裁朱克伯格、億萬富豪馬斯克，以嘲諷科技文化、AI及企業過度擴張等行為。

Posted April 17, 2025

0

人形機械人｜眾擎PM01機械人售價19萬
世界級網紅「甲亢哥」（IShowSpeed）早前訪華，於深圳與「眾擎PM01」機械人共跳「斧頭舞」。最近這款人形機械人量產，在眾擎京東自營旗艦店上架，售價18.8萬元人民幣，預計到今年6月底才有貨。

Posted April 17, 2025

0

AI代勞損信任｜哈佛教授提醒易遭識破損信任企業CEO與員工交流忌以AI代勞
最新一期《哈佛商業評論》刊登文章，探討企業高層及行政總裁（CEO）使用人工智能（AI）工具代筆，或引發對內部信任的損害。

Posted April 17, 2025

0

POPULAR POSTS

貿易通｜AI偵破深偽準確率98% 圖像影片換臉變聲無所遁形

 GitHub｜誤封中國斷網19小時

 假AI？｜美電商菲律賓聘真人扮AI

吉卜力漫畫化掀版權爭議（方保僑）

Meta壟斷案｜正式開審朱克伯格作供

 AI電影節｜35部片入圍周六科大放映知名導演編劇雲集

 嘲諷科技文化｜矽谷過路處按鈕被駭遭惡搞

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe