Don't Miss

科技大突破｜模型運算快逾十倍 Groq晶片挑機輝達

By 信報財經新聞 on February 22, 2024

原文刊於信報財經新聞「EJ Tech 創科鬥室」

聊天機械人背後必須依賴晶片運算。美國人工智能（AI）晶片初創Groq最近聲名大噪，該企主打研發「語言處理單元」（LPU）晶片，當中採用張量流處理器（TPS）架構，克服計算量、記憶體頻寬兩大樽頸，聲稱其大型語言模型（LLM）的推理效能比頂級雲端供應商快18倍，足以挑戰輝達（Nvidia）圖像處理器（GPU）地位。

相比輝達GTX 1070（右）晶片，Groq研發的GroqChip（左）結構簡單得多。（X網上圖片）

Groq網站最近公開API（應用程式介面）金鑰，並免費提供100萬Token（1個Token約等於英文4個字元），給已獲批准的會員試用10天。以執行Meta Llama2 7B模型為例，每秒可輸出750個Token，較OpenAI旗下GPT-3.5每秒40個Token快得多，價格為每100萬Token只需0.1美元，可說快如閃電且成本相宜。

Groq處理大型語言模型時，每秒可輸出數百個Token，推理速度比ChatGPT快得多。（YouTube影片擷圖）

微軟自研新網絡卡

據Artificial Analysis發布的第三方測試，Groq每秒產生247個Token，反觀微軟每秒僅18個Token，若ChatGPT在Groq的晶片上運行，其運行速度有望提高12倍以上。此外，The Information網站消息稱，微軟正開發一款新網絡卡，作為輝達網絡卡ConnectX-7替代品。

支持EJ Tech

如欲投稿、報料，發布新聞稿或採訪通知，按這裏聯絡我們。

Groq 晶片

Tweet

Pin It

Related Posts

DeepSeek掀生態整合戰（方保僑）

DeepSeek掀生態整合戰（方保僑）

Meta晶片｜傳測試自家人工智能晶片

Meta晶片｜傳測試自家人工智能晶片

開源晶片｜內地藉開源RISC-V晶片破圍堵

開源晶片｜內地藉開源RISC-V晶片破圍堵

狂人總統｜特朗普團隊據報尋求加強拜登時期對華晶片管控

狂人總統｜特朗普團隊據報尋求加強拜登時期對華晶片管控

Latest News

超級寬頻早着先機（林國誠）
在資訊爆炸、技術快速發展的年代，上網速度已不僅關乎日常娛樂或下載資料，更成為推動人工智能（AI）普及的重要基礎。

Posted March 28, 2025

0

量子電腦｜谷歌量子專家預計最快5年技術突破
谷歌量子人工智能硬件總監凱利（Julian Kelly）接受外媒CNBC訪問時指，現距離技術突破尚有5年時間，料屆時將做到現代電腦無法計算的實際應用。

Posted March 28, 2025

0

JUMPSTARTER｜信標生醫贏阿里環球創業賽
阿里巴巴（09988）創業者基金/滙豐JUMPSTARTER for One Earth環球創業比賽昨天宣布結果，最終由早期癌症檢測液體活檢測試公司Pharus Diagnostics（信標生醫）勝出。

Posted March 28, 2025

0

MCP｜OpenAI採用MCP技術利開發
ChatGPT開發商OpenAI昨天宣布接入開源標準「模型上下文協議」（Model Context Protocol, MCP），進一步推動人工智能（AI）模型與資料來源的整合標準化。

Posted March 28, 2025

0

AI Agent｜微軟推智能代理做研究分析
微軟（Microsoft）於生產力應用程式Microsoft 365 Copilot，推出兩個分別名為Researcher（研究員）及Analyst（分析師）的「深度推理」代理（Agent）。

Posted March 28, 2025

0

吳恩達｜AI應用始能創造價值
人工智能（AI）專家吳恩達近日接受台灣媒體專訪，提到「對於大多數企業而言，真正的價值將存在於應用層面」。

Posted March 28, 2025

0

阿里開源AI模型｜手機適用可圖文影音輸入設男女聲解答
阿里巴巴（09988）昨天在Hugging Face及GitHub等軟件平台，開源首個端對端多模態AI模型Qwen2.5-Omni-7B，可供處理文字、圖像、音訊及視訊在內的輸入，同時產生即時文字及自然語音回應。

Posted March 28, 2025

0

EJ Tech Video

POPULAR POSTS

氛圍編程｜AI代勞零程式碼寫App 用自然語言隨心設計降開發門檻

 理大初創積極貢獻世界科技與創意締造智慧美好未來

 Outlier｜AI訓練員集體起訴數碼血汗工廠表面優差實遭拖糧處理內容不堪入目

 Outlier｜海外聘自由撰稿人以廣東話參與寫作

 科泓科技｜AI聲紋配音保留角色神髓

 本地創科動態｜科大新法減AI量子運算延誤

 AI點餐｜KFC必勝客夥輝達研AI點餐

 ChatGPT新功能｜GPT-4o新增影像生成免費用

 超級寬頻早着先機（林國誠）

成為 EJ Tech 會員

接收最新創科資訊

Click here to unsubscribe