生命的無限可能 Potential of human life: 在東京看見 Google 大未來：所有產品都將融入「機器學習」

這一兩年來 Google 陸續推出的服務，從 Google Photos、Now On Tap、Google Now 到上週最新面世的 Gmail「自動回信」功能，都有個共通點：他們都深刻運用了「機器學習」的原理。在第三季的財報會議中，剛接任 Google CEO 的 Sundar Pichai，明白宣示1機器學習將是 Google 大力推動的方向：

機器學習是一種核心的轉變方式，透過機器學習，我們正在重新思考我們所從事的一切。我們將審慎的把所有產品，包括搜尋、廣告、YouTube、Google Play 等等全部融入機器學習。我們目前正處於初期階段，但用戶將看到 Google 以系統的方式來思考我們將如何把機器學習應用到所有的這些領域。

昨天 Google 於東京舉辦的亞太區媒體活動，Alphabet 執行董事長 Eric Schmidt 從華盛頓特區視訊連線，去年他在同樣的活動場合中表示「亞洲走在行動唯一的道路上」，而今要讓人類生活再進化，Google 將大舉投資機器學習，篤定它將成為改變世界的 Next Big Thing。Google 機器學習核心團隊成員 Greg Corrado 也更細緻的何謂解釋機器學習。我們整理五大重點，一覽機器學習的力量。

什麼是機器學習

Greg Corrado 解釋，過去工程師使用「建立與排除規則」的方式讓電腦學習，但機器學習的邏輯完全不同：透過極大量的樣本與案例預測與學習。

理想的機器學習進程是：輸入 => 進入可以加入各種參數或變因的模型 => 週而復始不斷預測結果，並將預測結果與真實結果加以比對，即產生學習的機制。範例愈多、比較愈多次，學習的效果就會愈好，往後得出的結果也會愈精準。人類雖然也透過經驗學習，但是我們的大腦只需要幾次的例子就能舉一反三，而電腦卻得吞食巨量的案例才能建立認知。

若把機器學習愈為一艘火箭，大量的數據就是驅動它的能源。Greg Corrado 強調，機器學習不是魔術，而是工具。在機器「學習」的進程中，人類必須發揮創意與多方思考，建立不同模型，並以強大的運算能力支撐整個學習過程。

機器學習進展到後來，變成接近人腦的深度學習。藉由層疊許多模型，形成更加複雜的學習方式，例如電腦看到貓的影像後，經過好幾個層次的運算，便得出「這是一隻貓」的結論。

電腦認出一隻貓的過程，宛若「全面啟動」

當天一同與會的 Google Photos 搜尋和分析負責人 Chris Perry，更進一步介紹 Google 引以為傲的「電腦視覺」技術。自 Google Photos 推出以來，每月超過 1 億人使用，並累計儲存超過 500 億張照片。以往我們利用關鍵字搜尋照片，大概只能找到當初有被標籤為特定字詞的影像，但現在打「貓」或「巴黎鐵塔」等等，即使該照片並未被標記關鍵字，還是會被呈現出來，這就是電腦視覺的威力。

以巴黎鐵塔來說，如果相片缺乏定位資訊，Google 會先找出這張照片的巴黎鐵塔，接著與其他含有巴黎鐵塔的照片進行比對，由於地標形狀永遠不會改變，辨識相對容易。若比對成功，就把這張照片標示為「巴黎鐵塔」，並分類到巴黎中。

但若是動物難度就很高了。例如，上百萬隻貓咪長相、姿態不盡相同，就需要更複雜的電腦視覺運算，去年九月 Google 發表關於神經網絡（neural network）的論文，命名為「全面啟動（inception）」，因為 Google 歷經 22 層的電腦視覺運算原理，如同全面啟動中夢境的分層概念。例如 Google 準備辨識一隻貓的照片，首先會先偵測線條與顏色、接著是眼睛與耳朵，經過數層辨識後，終於認出這是一隻貓。但任務尚未結束，Google 需要從網路中上千張「貓」的影樣與「貓」的連結，推斷出「貓」這個字通常與「尖耳、生動的線條」的生物聯繫在一起。於是，當人們在搜尋框中打上「貓」，無論照片是否被標記了「貓」，Google Photos 都能吐出相關影像。

只是，雖然 Eric Schmidt 大力推崇藉由機器學習，電腦視覺（computer vision）將比人眼更精準銳利，但目前實務上仍無法 100% 判斷正確的是非。比方說先前 Google Photos 曾經出現把非裔人士標記為黑猩猩的烏龍，又或者是人工標籤，也有可能發生許多人誤把布魯克林大橋錯置為舊金山大橋的狀況，靠著大量統計資訊進行學習的系統缺乏文化社會常識，的確只能靠著後續更多資料比對提出反證，或是藉著人為手動修正。

Eric Schmidt 也在視訊中表示，要把問題轉換成機器學習能解決的題目並不容易，但一旦轉換成功，人人都將受益。

緣起於 20% Project，機器學習將改變世界

Google 發展深度學習，其實源自於 2011 年享譽盛名、給予工程師自由時間發展個人專案的「20% Project」，成員包括已經加入中國百度的吳恩達（Andrew Ng）、在科技圈名聲響亮的 Jeff Dean、以及 Greg Corrado 等人。歷經數次失敗後，因在語意辨識（speech recognition）上取得重大進展，而且電腦與智慧型裝置的運算能力大幅增強，因此從 GoogleX「畢業」，成為 Google 正式投入發展的專案。

其後，深度機器學習陸續運用在各式各樣的 Google 產品中，你我生活中離不開的搜尋、99% 的垃圾郵件區辨率、Google 翻譯、自動歸類照片、自動回覆、以及自動回覆，都是仰賴機器學習的成果，Eric Schmidt 上週在韓國首爾透露2，「未來五年機器學習將應用在所有產業領域，光 Google 正在進行的相關專案就超過 100 個。」

TensorFlow 開源，Google 不走尋常路

現在，為了讓機器學習的發展快馬加鞭，Google 邀請全世界攜手加入訓練機器的行列。

前天 Google 宣布將旗下機器學習軟體系統「TensorFlow」以開源專案釋出。TensorFlow 已運用在 Inbox 的 Smart Reply、Google Photos 的搜尋功能、YouTube 的最佳縮圖（thumbnail），能在小至一台智慧型手機或多達數千台電腦的資料中心中運行。TensorFlow 打造、訓練神經網絡的速度比起舊版系統 DistBelief 快了五倍。

就像先前提到的，機器學習兩大關鍵元素：資料量以及人類賦予的創造力，Google 開源的舉動，無疑是要藉助社群力量，將機器學習的觸角延伸到無所不在。往後研究者、工程師或任何對機器學習有興趣的群眾，都能利用程式碼快速交流，加快機器學習領域發展。另外科學家也能利用 TensorFlow 分析並解讀複雜數據，例如蛋白質折疊或天文數據運算。

雖然機器學習已成顯學，蘋果、微軟、IBM 都有秘密武器，但 Eric Schmidt 自信的說，TensorFlow 要「讓全世界的聰明人都能運用 TensorFlow，甚至連競爭對手都會用它，Google 不走尋常之路。」。

暫且不會朝向人工智慧發展

機器學習經常被拿來與人工智慧相提並論，但人工智慧總是令人充滿「取代人類」的憂慮不安。不過 Greg Corrado 解釋，兩者雖有相疊之處，但本質上並不一樣。人工智慧是「讓機器變聰明」，IBM 的 Deep Blue（深藍電腦）即屬此類，而機器學習是希望「由人類訓練機器，讓它從不斷學習中變聰明」，後者要比前者來得簡單可行，Google 也以機器學習為主要目標。Greg Corrado 說，Google 現階段還是以讓人類的生活更加便利、不必把時間浪費在瑣事上為主。

資料來源：在東京看見 Google 大未來：所有產品都將融入「機器學習」 - Inside 硬塞的網路趨勢觀察

網頁

2015年11月12日星期四

在東京看見 Google 大未來：所有產品都將融入「機器學習」

什麼是機器學習

電腦認出一隻貓的過程，宛若「全面啟動」

緣起於 20% Project，機器學習將改變世界

TensorFlow 開源，Google 不走尋常路

暫且不會朝向人工智慧發展

沒有留言:

網頁

2015年11月12日 星期四

在東京看見 Google 大未來：所有產品都將融入「機器學習」

什麼是機器學習

電腦認出一隻貓的過程，宛若「全面啟動」

緣起於 20% Project，機器學習將改變世界

TensorFlow 開源，Google 不走尋常路

暫且不會朝向人工智慧發展

沒有留言:

2015年11月12日星期四