我在Google無人車研究組的日子
本文作者田淵棟,2005 年及 2008 年獲上海交通大學電子資訊及電氣工程電腦系學士學位及碩士學位,2013 年獲機器人系博士學位,主要研究電腦視覺,機器學習及最優化方法,在頂級會議上發表過多篇會議及雜誌論文,曾獲 2011 年微軟博士研究獎學金,獲 2013 年國際電腦視覺會議(ICCV)最佳論文提名獎。現於 Google X 實驗室 (Google X Lab) 無人駕駛汽車 (Google driverless car) 研究組,擔任研究員 / 軟體工程師職位。本文寫於 2014 年 1 月。
到 Google 無人車組全職工作已經有四個月了。寫一下感想。
鑒於項目的高度機密性,很多話不能說,我唯一能透露的,就是兩條:同事們都很厲害,然後都非常努力。主管不怎麼主動管,但大家都明白如果事情做不完就得加班,因為一個一個小發佈(release)的最後期限(deadline)擺在那裡。節奏很快,不像是在大公司裡工作,反倒更像是在一個初創團隊裡忙碌。
這四個月感覺下來,Google[x] 實驗室有幾個很有趣的特點。其一是軟硬件結合極其緊密,這一點從已有的報導裡可以看出,不論是無人車 (Self-driving car),眼鏡 (Google Glass) 還是最近公佈的氣球無線網路 (Loon) 及能測血糖的隱形眼鏡 (Iris),都是軟硬結合的產品。這直接導致的結果,就是我們每天面對的問題和之前在學術圈時思考的完全不同。
在學術圈,問題的已知條件和資料集都是給定的,我們要做的就是像解數學題一樣,鑽進去找到更好的解法,並在已知的資料集上和前人對比證明其有效性。但在 Google[x] 則完全不同,大的項目(比如說開發無人車)擺在這裡,但已知條件,解決方案,使用何種硬件,如何分配資源,都是不確定的;唯一確定的,是要以最快的方式和最小的成本把它實現出來,讓一輛車能安全地自行其道,同時生產成本又最少。
在這樣的特定背景下,碰到一個難題,首先想的不是如何把它不計成本地解出來,而是問自己有沒有必要解它,能不能繞開它而實現目標?事實證明,在這樣高自由度的空間裡尋找一個特定的解決方案,幾乎總是能繞過學術界的難題,找到簡單易行的實用方法。
這就像要發明能在道路上移動的機器人,不是絞盡腦汁去研究人類兩足的機理,而是用容易控制又廉價的輪子代替;要設計飛機,不去模仿鳥類形態優美卻機理複雜的撲翼,而是使用固定機翼加噴氣動力。
其二是幾乎沒有專職的研究職位。所有人既是研究員 (Researcher),又是軟件工程師 (Software Engineer)。基本上每個人負責一個具體的方向,對這個方向自主地分析現存的問題,並不斷通過和同事討論提出新方案,最後評估方案的效果。就算是組裡的主管(Manager),甚至是主管的老闆,也要寫代碼查錯誤完成具體工作,唯一的不同點,是他們對系統有更整體的理解,遇到問題能幫忙找到下屬找不到的角度。碰到許多工同時需要完成的時候,能分清主次,丟卒保車,確保整個組的大方向正確。
對於從來沒有碰到過的新問題,思考新思路和寫代碼開發是同時進行的,C++ 代碼寫完就直接上產品去測試看效果如何,不行就分析研究再換一種,如此快速反覆運算直到找到好方案為止,如果一兩星期裡找不到好方案,那就認為這個問題是困難的,於是就要退一步思考,想辦法繞開它。
因為這個原因,諸如「寫代碼和做研究的時間比例是多少」之類的問題就沒有什麼意義,因為完全看需要解決的是什麼問題,寫很多格式漂亮架構清晰的代碼卻不能解決問題沒有意義,天馬行空地思考不在實際資料上跑也沒有意義,最重要的只是「解決問題」這四個字。
這種思路決定了研究風格是「具體問題具體分析」式的,有額外條件和額外資訊就儘量用上,不會花時間思考一般情況;是「崇尚簡單方案快速出結果」式的,而不會使用精巧複雜卻不太直觀的數學理論,也不會花幾個月賭一個萬能演算法。這種研究方式的缺點顯而易見,就是沒有辦法產生深遠及本質的成果,但是既然目標是利用人類現有的技術,去完成一個舉世矚目的新系統和新產品,我想不出來有其它更好的推動方式了。
其三是組內資訊交流的極端重要性。學術界強調鑽研問題,獨立工作和原創性成果;業界強調合作,共同解決問題。一個人,特別是剛進來的新人,對整個系統的組成沒有深刻理解,也不去詢問同事,主管給一個問題就按自己的想法單幹,結果發現三分之一工作和無人車目前急需解決的難點無關,三分之一工作已有人做出過類似工具,還有三分之一工作聽起來很有道理,自成一說,但是在實際資料上一跑效果很差。這些情況是完全可能的。按學術界的思路,這些工作都可以成為不同風格的學術文章,但在我們這裡,全都是沒有用的。
而充分交流討論就能避免這類情況。有越多來自別人的資訊,就越能明確目標直入主題;越知道系統的優劣和目前的可用工具,就越能借風使力,提高效率。有時候跨組間不經意的一兩句對話,少則抵得上幾小時或者幾天的辛勤勞作,多則改變整個組的行進方向。無人車組裡中國人非常非常少,因此英語的地位相應提高,實在是需要在業餘時間多加訓練才好。
對於這樣一個開創性項目,雖然已經取得了重要的進展,但還是有很多棘手的具體問題需要解決,每一個細節都決定成敗。並且,越接近最終目標就越為艱難,有時候為了有百分之一的效果提升,是不惜從頭再來,將原來的工作全部推翻的。所以說這個項目最後是否成功,還要看全體同事的聰明才智和勤奮努力,及一點點捉摸不定的運氣。
希望運氣在我們這邊。
田淵棟 2014 年 1 月 23 日
[原文:36Kr]
支持EJ Tech
如欲投稿、報料,發布新聞稿或採訪通知,按這裏聯絡我們。
Related Posts
Latest News
-
AI趨勢|OpenAI多地推AI代理工具Operator
聊天機械人ChatGPT開發商OpenAI在社交平台發文表示,正在向澳洲、巴西、加拿大、印度、日本、新加坡、南韓、英國等地的ChatGPT Pro用戶推出人工智能(AI)代理工具「Operator」,可以代表用戶執行任務。
- Posted February 21, 2025
- 0
-
AI大戰丨OpenAI擬下周推GPT-4.5 GPT-5或5月登場
美國傳媒報道,OpenAI將最快下周公布其最新人工智能(AI)模型GPT-4.5,而GPT-5則有望於5月下旬發布。更新後的GPT-5將對ChatGPT的使用方式進行重大改進,統一OpenAI的o系列和GPT系列模型,減少使用者選擇模型的困惑。
- Posted February 21, 2025
- 0
-
AI Pin|襟章策略失利 新星初創被HP收購
美國科技巨企惠普(HP)擬斥資1.16億美元(約9億港元),收購當地初創Humane大部分股權,接收對方多數員工、人工智能(AI)平台Cosmos,以及超過300項專利權,有關交易預計本月底完成。
- Posted February 21, 2025
- 0
-
全新視角觀賞熊貓寶寶生活(林國誠)
「熊貓TV」正式進入第二階段,新增設置於「大熊貓之旅」的6支鏡頭並引入多項嶄新功能,讓市民能以全新視角、多角度、更自由的方式觀賞「盈盈」、「樂樂」,以及牠們的龍鳳胎寶寶「家姐」與「細佬」的生活點滴。隨着這些升級功能的推出,熊貓熱潮勢必再掀高潮!
- Posted February 21, 2025
- 0
-
進軍電玩界|微軟推Muse動作模型 生成式AI闖遊戲開發
利用生成式人工智能(Generative AI),有助改革創新工業發展。微軟(Microsoft)研究團隊介紹一款名為Muse的「世界及人類動作模型」(WHAM),有關成果由微軟研究院旗下「遊戲智能」、「可教學AI體驗」兩組人員,跟英國劍橋遊戲開發工作室Ninja Theory合作完成。
- Posted February 21, 2025
- 0
-
理大夥中移香港拓6G應用
香港理工大學與中國移動(香港)創新研究院達成合作協議,並簽署合作備忘錄及合作項目協議。校長滕錦光(後排左二)稱,今次合作充分發揮學術界與業界的協同優勢,雙方將聚焦戰略性的科技領域,包括人工智能(AI)、6G及Web3等範疇的技術革新及應用。
- Posted February 21, 2025
- 0
-
Apple新機|iPhone 16e今預訂 入門版售5099元
Apple 發布最新款智能手機iPhone 16e,搭載最新一代A18晶片及4核心圖像處理器(GPU),可流暢運行Apple Intelligence,例如AI寫作工具、Genmoji、Image Playground等人工智能(AI)功能。
- Posted February 21, 2025
- 0
EJ Tech Video
POPULAR POSTS
-
Grok 3|馬斯克「最醒」AI模型登場 Grok 3香港可用 月費170元
-
點語成丹青|港首辦成語變畫作AI比賽 120間中小學參與 收逾千作品
-
AI「炒散」|AI模型接編程散工 獨立開發力遜人類
-
EzyGreenPak|環保袋減廢遇熱水即溶 港EzyGreenPak專利 今屆渣馬採用
-
EzyGreenPak|自家平台監控碳排 助家族工廠轉型
-
DeepSeek|據報新增互聯網訊息服務
-
AI大戰|馬斯克聊天機械人Grok 3亮相 稱性能勝DeepSeek
-
神經元記錄|哈佛研CMOS矽晶片 記錄神經細胞活動
-
X危機?|馬斯克旗下X傳以3432億估值洽融資
-
AI研究院|理大成立「人工智能+研究院」