All posts tagged "Grok 3"
-
AI搜尋犯錯|美大學測試 Grok 3錯誤達94%
原文刊於信報財經新聞「CEO AI⎹ EJ Tech」 美國哥倫比亞大學旗下「托姆數碼新聞中心」,測試了8種工具即時搜尋功能的生成式人工智能(GenAI)工具,分別是ChatGPT Search、Perplexity、Perplexity Pro、DeepSeek Search、Copilot、Grok 2 Search、Grok 3 Search及Gemini,以驗證其準確檢索及引用新聞的能力。 8種工具 逾六成錯引文章 為評估聊天機械人是否準確,研究人員採取一項控制實驗,首先從20個出版商隨機抽出10篇新聞。下一步,人手從每篇文章中,提取特定段落用作查詢。每個AI的任務是識別文章的標題、原始發布者、出版日期及網址。測試後發現,六成以上查詢結果,引用了錯誤的文章;Perplexity有37%查詢答錯,Grok 3錯誤率高達94%。 研究人員同時發現,無法準確回應的問題,聊天機械人通常不會回答,反而以驚人的信心,提供不正確或推測性的答案,卻很少使用「看起來」、「有可能」、「也許」等字眼,令用戶難以分辨準確與否的資訊。 此外,多個聊天機械人在測試時,似乎繞過「機械人排除協議」,令出版商對內容失去決定權,例如是否被納入搜尋,或用作AI模型的訓練資料。以《今日美國報》(USA Today)為例,該報社封鎖了ChatGPT爬蟲機械人,但機械人仍引用雅虎重新發布的文章。
- Posted March 12, 2025
-
Grok 3|馬斯克「最醒」AI模型登場 Grok 3香港可用 月費170元
繼確認成立人工智能(AI)遊戲工作室後,美國億萬富豪馬斯克(Elon Musk)昨與旗下初創xAI團隊人員,介紹第三代聊天機械人Grok 3,更形容它為「地球上最聰明AI」,網上直播獲超過455萬人次觀看。
- Posted February 19, 2025
-
AI大戰|馬斯克聊天機械人Grok 3亮相 稱性能勝DeepSeek
馬斯克和其xAI團隊人員在美國時間周一晚上網上直播發布Grok 3,並在進行現場示範,期間有逾370萬人次觀看直播。他們指出,Grok 3在很短的時間內實現功能比Grok2強大一個數量級,在多個基準測試中優於OpenAI的GPT-4o、Anthropic的Claude-3.5、DeepSeek V3和Google旗下Gemini 2.0 Pro。
- Posted February 18, 2025