谷歌新功能 哼旋律搵歌曲 AI升級搜尋引擎 極速有結果
原文刊於信報財經新聞「StartupBeat創科鬥室」
相信不少人曾試過腦海中偶爾浮現一些歌曲旋律,但總是記不起歌名。科技巨擘谷歌(Google)近日利用人工智能(AI)及機器學習技術,為其搜尋引擎新增多項功能,包括hum to search(哼歌搜尋)功能,讓用戶以哼唱搜尋對應歌曲。目前新功能在iOS只設英語版本,Android則支援超過20種語言。
據谷歌網站介紹,要使用「哼歌搜尋」功能,用戶須打開谷歌搜尋應用程式(App)或Google助理,點擊語音輸入圖示,並發問「What’s this song(這是什麼歌)?」或點擊新增的「Search a song(搜尋歌曲)」按鈕,然後哼出、吹口哨或唱出旋律約10至15秒,即可列出歌曲的相關資訊、影片,或直接開啟音樂App播放。
強化拼寫算法應付錯字
谷歌解釋,歌曲旋律像人類的指紋,可辨識身份,新建立的機器學習模型,能把用戶哼唱的聲音轉換為一串代表歌曲旋律的數字,然後跟現有歌曲比對。由於模型使用多種聲音資料訓練,包括人類歌聲、口哨及哼唱等,同時消除音色、音調及配樂等歌曲細節。就算用戶五音不全,亦可成功搜尋歌曲。
另外,科技媒體TechCrunch報道,谷歌一直使用「did you mean(你是否要搜尋)」功能,建議使用正確的拼寫,但每日有15%搜尋查詢是從沒見過,部分原因是用戶錯誤輸入搜尋字眼,平均每十個查詢就有一個輸入錯誤。
智能鏡頭拆解數理公式
谷歌本月底將升級全新拼寫算法,由6.8億個參數的深層神經網絡驅動,能更好地了解用戶的上文下理,聲稱3毫秒內完成搜尋。
至於其他更新還包括Google智能鏡頭,只須利用相機或相片,即可讓用戶搜尋眼前所見內容。用戶未來還可以要求程式讀出照片中任何文字,更能理解數學、化學、生物以至物理公式等,從網上搜尋各種解題方法,協助逐步解答問題,相信有助學生學習。
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。
Related Posts
Latest News
-
區塊鏈技術為數碼經濟奠基(林國誠)
近年來,區塊鏈技術在各行各業的數碼轉型發揮了重要作用,其應用已超越加密貨幣的範疇,廣泛滲透至供應鏈管理、電子病歷管理、跨境支付及版權保護等多個領域。
- Posted January 17, 2025
- 0
-
善用科技對抗網上假消息(黃岳永)
引發情緒反應的聳動標題,才能吸引讀者關注。因此,要避免受騙或成為散播假消息的幫兇,就需要具備辨別事實與虛構的能力。
- Posted January 17, 2025
- 0
-
AI醫學|化學諾獎團隊用AI 設計抑制蛇毒蛋白質
蛇毒含有複雜的毒素混合物,大部分成份是蛋白質。獲頒2024年化學諾貝爾獎的美國華盛頓大學教授貝克(David Baker),其團隊以一款人工智能(AI)軟件工具RFdiffusion,設計了全新的蛋白質,聲稱能夠抑制眼鏡蛇的三指毒素(3FTx)。
- Posted January 17, 2025
- 0
-
Microsoft Copilot|加推Copilot Chat 逐條訊息收費
微軟(Microsoft)為企業用戶推出新產品Microsoft 365 Copilot Chat,服務以OpenAI旗下GPT-4o的人工智能(AI)模型為基礎,讓用戶提出與業務相關的問題、建立工作流程自動化或產生圖像等。
- Posted January 17, 2025
- 0
-
OpenAI|美印測試 手機號碼開戶
聊天機械人ChatGPT開發商OpenAI,正於美國及印度測試一項功能,容許新用戶毋須電子郵件,以手提電話號碼註冊新賬戶,惟未計劃推廣至其他地區。
- Posted January 17, 2025
- 0
-
中國發明|極速機械豹 每秒最快跑10米
浙江大學杭州國際科創中心人形機器人創新研究院,聯合鏡識科技有限公司、凱爾達(688255.SH)焊接機器人股份有限公司共同研發的「黑豹2.0」,號稱是全球跑得最快的「四足機械人」。
- Posted January 17, 2025
- 0
-
去中心化社媒崛興 回歸原創內容
隨着短片分享平台TikTok在美國遭封殺在即,Meta放寬旗下應用程式的內容限制,以至社交平台X(前稱Twitter)持續改動演算法等,社交媒體世界掀起轉會潮。
- Posted January 17, 2025
- 0