Don't Miss

AI不當回應｜GPT-4.1建議用戶入侵賬號解悶

By 信報財經新聞 on April 25, 2025

原文刊於信報財經新聞「CEO AI⎹ EJ Tech」

ChatGPT開發商OpenAI早前推出新一代人工智能（AI）模型GPT-4.1，惟未按慣例同步發布技術報告與安全評估。當科學家、開發者自行測試其行為表現後，發現新模型在可靠度與對齊性上，表現皆不如前代模型GPT-4o。

英國牛津大學AI研究員Owain Evans指出，利用不安全代碼與資料微調的GPT-4.1，會對性別角色等敏感議題作出不當回應，甚至出現一些「新的惡意行為」。他在社交媒體舉出一個例子，就是用戶表示感到沉悶後，模型竟建議對方入侵朋友賬號「惡搞」，但又誘導用戶先洩露自己的密碼。

美國AI安全公司SplxAI亦對GPT-4.1測試，在約1000個模擬場景中發現，該模型更容易偏離主題，而且容許蓄意濫用，頻率高於另一模型GPT-4o。同時，GPT-4.1偏好明確指令，導致它對模糊語句處理能力較弱，增加出現非預期行為的機會。

傳今夏釋出開源模型

科技媒體TechCrunch引述消息人士指出，OpenAI有傳今年夏季釋出一個開源模型，目標其表現勝過同類模型，可在高階消費級硬件上運行。此外，容許模型切換推理開關，而且作出寬鬆授權，盡量不設用途限制。若外界反應良好，後續有望推出更多開源模型。

OpenAI有傳今年夏季釋出開源模型，可在高階消費級硬件上運行。（路透資料圖片）

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

AI GPT-4.1 OpenAI SplxAI

Tweet

Pin It

Related Posts

全球AI發展陷十字路口（方保僑）

全球AI發展陷十字路口（方保僑）

DeepMind｜創辦人倡監督AGI

DeepMind｜創辦人倡監督AGI

Anthropic｜冀破解AI內部運作

Anthropic｜冀破解AI內部運作

AI法規｜歐盟擬簡化AI法規追趕中美

AI法規｜歐盟擬簡化AI法規追趕中美

Latest News

小米手機｜內地市佔19%稱冠
市場調研機構Canalys最新數據顯示，小米（01810）手機於今年首季在中國市場市佔率達19%，位居榜首，按年增長5個百分點。

Posted April 28, 2025

0

全球AI發展陷十字路口（方保僑）
美國特朗普政府近期的關稅政策反覆無常，近日又全面禁止輝達（Nvidia）向中國出口特供版人工智能（AI）晶片H20，令輝達需要減記55億美元庫存與採購費用，股價單日重挫近7%。

Posted April 28, 2025

0

DeepMind｜創辦人倡監督AGI
Google DeepMind行政總裁、諾貝爾化學獎得主哈薩比斯（Demis Hassabis）警告，世界正在接近實現「通用人工智能」（AGI）的最後階段，但社會尚未準備好迎接這種能達到人類認知能力的AI系統。

Posted April 28, 2025

0

Anthropic｜冀破解AI內部運作
美國科企Anthropic聯席創辦人及行政總裁阿莫迪（Dario Amodei）發表文章指出，人工智能（AI）技術勢不可擋，惟可解釋性（Interpretability）才是業界與政策制定者應該關注的焦點。

Posted April 28, 2025

0

AI法規｜歐盟擬簡化AI法規追趕中美
歐盟日前啟動人工智能大陸（AI Continent）行動計劃，敲定逾2000億歐羅龐大投資細節，標誌AI政策出現重大轉向。

Posted April 28, 2025

0

國泰航空｜重塑辦公空間增進員工溝通
面對航空營運日益複雜的挑戰，國泰（00293）綜合運作中心（IOC）近年積極引進人工智能（AI）輔助決策，並且同步重塑辦公空間，希望藉此打破部門隔閡，促進跨部門以AI工具即時溝通與協作。

Posted April 28, 2025

0

國泰航空｜數十AI模型應用廣橫跨30多部門涵蓋維修客服監控
作為本港航空業界的代表，國泰航空（00293）早就引進人工智能（AI）解決方案，涵蓋辦公效率、維修管理、航班調度、客戶服務及內部排班等多個應用範疇。

Posted April 28, 2025

0

POPULAR POSTS

AI作弊系統｜輟學生誓言欺騙一切 AI作弊系統吸4134萬

 AI編程｜奧巴馬：AI編程勝過七成專家

 AI不當回應｜GPT-4.1建議用戶入侵賬號解悶

 應科院｜25年轉移1500項技術

 探索大灣區科技創新（湛家揚博士）

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe