完全解讀：人工智慧新商業--人工智慧三大關鍵技術

admin · 發表於 2017-5-11 17:45:28

關鍵技術一：文藝復興後的人工神經網絡
對於人工智慧，電腦科學家當然希望可以直接模仿生物的神經元運作，因此設計數學模型來模擬動物神經網絡的結構與功能。
所謂人工神經網絡是一種仿造神經元運作的函數演算，能接受外界資訊輸入的刺激，且根據不同刺激影響的權重轉換成輸出的反應，
或用以改變內部函數的權重結構，以適應不同環境的數學模型。

1951年，科學家馬文．閔斯基（Marvin Minsky）第一次嘗試建造了世上第一個神經元模擬器：Snarc（Stochastic Neural Analog Reinforcement Calculator），它能夠在其40個「代理人」和一個獎勵系統的幫助下穿越迷宮。六年後，康乃爾航空工程實驗室的法蘭克．羅森布拉特（Frank Rosenblatt）設計、發表神經網絡的感知器（Perceptron）實作後，人工神經網絡（或稱類神經網絡）學者曾經一度振奮，認為這個突破終將帶領人工智慧邁向新的發展階段。

但，人工智慧領域的研究在1970年代因為缺乏大規模數據資料、計算複雜度無法提升，無法把小範圍的問題成功拓展為大範圍問題，導致計算機領域無法取得更多科學研究預算的投入而沉寂。到了1980年代，科學家首先透過思考上的突破，設計出新的演算方法來模擬人類神經元，迎來神經網絡發展的文藝復興時期。物理學家約翰．霍普費爾德（John Hopfield）在1982率先發表Hopfield神經網絡，開啟了神經網絡可以遞迴設計的思考。四年後，加州大學聖地牙哥分校教授大衛．魯梅爾哈特（David Rumelhart）提出了反向傳播法（Back Propagation），透過每次資料輸入（刺激）的變化，計算出需要修正的權重回饋給原有函數，進一步刷新了機器「學習」的意義。科學家更進一步把神經元延伸成為神經網，透過多層次的神經元締結而成的人工神經網絡，在函數表現上可以保有更多「被刺激」的「記憶」。

目前多層次的人工神經網絡模型，主要包含輸入層（input layer）、隱層（hidden layer）與輸出層（output layer），另外根據資料輸入的流動方向，又分為單向流動或可以往回更新前一層權值的反向傳播法。由於神經網絡模型非常仰賴計算規模能力，為了增加高度抽象資料層次的彈性，電腦科學家將之複合為更複雜、多層結構的模型，並佐以多重的非線性轉換，將其稱之為深度學習（Deep Learning）。

關鍵技術二：靠巨量數據運作的機器學習
科學家發現，要讓機器有智慧，並不一定要真正賦予它思辯能力，可以大量閱讀、儲存資料並具有分辨的能力，就足以幫助人類工作。1970年代，人工智慧學者從前一時期的研究發展，開始思辯在機器上顯現出人工智慧時，是否一定要讓機器真正具有思考能力？因此，人工智慧有了另一種劃分法：弱人工智慧（Weak AI）與強人工智慧（Strong AI）。弱人工智慧意指如果一台機器具有博聞、強記（可以快速掃描、儲存大量資料）與分辨的能力，它就具有表現出人工智慧的能力。強人工智慧則是希望建構出的系統架構可媲美人類，可以思考並做出適當反應，真正具有人工智慧。

機器學習（Machine Learning）可以視為弱人工智慧的代表，只要定義出問題，蒐集了適當的資料（資料中通常需要包含原始數據與標準答案，例如人像圖片與該圖片內人像的性別、年齡），再將資料分做兩堆：訓練用與驗證用，以訓練用資料進行學習，透過特定的分類演算法抽取特徵值，建構出資料的數學模型，以該數學模型輸入驗證用資料，比對演算的分類結果是否與真實答案一樣，如果該數學模型能夠達到一定比例的答對率，則我們認為這個機器學習模型是有效的。這種具有標準答案，並以計算出的預期結果進行驗證的機器學習，通常被稱為監督式學習。

相對於監督式學習，非監督式學習則強調不知道資料該如何分類的機器學習，換句話說，我們提供電腦大量資料，但不告訴它（或許我們也真的不知道）這些資料該用什麼方式進行分類，然後電腦透過演算法將資料分類，人類只針對最終資料分類進行判別，在數據尋找規律就是機器學習的基礎。

機器學習的發展方向，是在設計、分析一些讓電腦可以自動「學習」的演算法，讓機器得以從自動分析資料的過程中建立規則，並利用這些規則對還沒有進行分析的未知資料進行預測。過程中，時常運用統計學技巧，並轉化成電腦程式，進而計算出資料的分界條件來做預測。

弱人工智慧作為人工智慧領域的發展途徑，無論是監督式學習或非監督式學習，隨著資料被大規模蒐集、經由網際網路被傳遞、輔以雲端架構支援的運算，用機器學習來解決人類基礎的問題變成一種可能。目前機器學習也是人工智慧商業應用最廣泛的一種技術。舉凡搜尋引擎、圖像辨識、生物特徵識別、語音與手寫識別與自然語言處理、甚至是檢測金融詐欺等等，都是常見的應用。

關鍵技術三：人工智慧的重要應用：自然語言處理
對人類來說，如何讓這些現代自己製造出來的機器們，可以聽懂人話，並與人類「合作」，絕對是可以推動我們面對未知宇宙的重要助手。
自然語言處理（Natural Language Processing, NLP）的研究，是要讓機器「理解」人類的語言，是人工智慧領域裡的其中一項重要分支。英國雷丁大學的演化生物學家馬克．佩葛（Mark Pagel）認為，最早的一種「社會科技」是人類的「語言」，語言的發明讓早期人類部落透過新工具：「合作」在演化上占有優勢。自然語言處理可先簡單理解分為進、出計算機等兩種：其一是從人類到電腦──讓電腦把人類的語言轉換成程式可以處理的型式，其二是從電腦回饋到人──把電腦所演算的成果轉換成人類可以理解的語言表達出來。

無論是從人類到電腦，或從電腦到人類，語言處理通常都使用到我們一般學習外語所要具備的聽、說、讀、寫等技能。其中：聽與說主要使用到聽覺與發音，對電腦而言就是能夠透過麥克風「聽」到人類說話，把聽到的聲音轉成文字（這是語音辨識），或把電腦想要表達的意思轉成人類可以理解的詞句（這是自然語言生成），再用耳機或喇叭「唸」給人類聽（這是語音合成，功能通常稱作文本朗讀：text to speech）。科學家與工程師們也致力於影像文字辨識，影像來源可以是掃描完成的文件影像檔案、也可以是手機鏡頭的即時影像，目標的文字體則可以是一般鉛字印刷品或列印的文件，也可以是手寫文字（手寫文字辨識）。

當計算機透過「聽」或「讀」，將人類的話語或文章轉成文字、語句進到處理層，還需要能夠自動分詞（word segmentation），也就是電腦必須拆解人類的語句來理解語意，才可以進而給出相應的答案。例如一般人對手機說：「今天香港會不會下雨」，手機必須錄下聲音、並且濾掉雜音、將這句話的聲音轉化為文字、將這句文字拆解成不同詞句，並標注上不同詞性（speech tagging）。

「瞭解」使用者想要知道氣象資訊的命令後，手機必須對能提供「天氣」資訊的伺服器發出相應的（告訴伺服器要的地理資料是香港、並把今天轉換為實際的日期時間）資訊請求，包含未來數小時區間氣溫、氣象（是多雲、雨或晴天等）、風速、降雨機率、濕度、氣壓、空氣品質或紫外線指數等。

當伺服器回應了前述的相應數據後，手機可以選擇用螢幕畫面來回應，但更貼心的作法是把這些資訊翻譯成「人話」，然後用聲音唸出來。這時的處理可以把「香港接下來八小時會是晴天，氣溫攝氏25度，降雨機率是10%，空氣品質良好」這個句子，透過合成不同語詞聲音後說出來。但是，使用者問的其實是「會不會」下雨，所以必須進一步把降雨機率10%、晴天等等資訊轉換成「會不會」的尺度，例如10%可以轉化為「不太會」或是「只有很小的機率」一詞。

人類互動最重要的工具就是語言，無論是文字或語音，語音智慧助理讓人能和機器說話，無非是近年行動裝置普及後，最令人興奮的進展之一。

人工智慧（Artificial Intelligence）的研究，過去60多年來從未停歇，而今總算有了不凡的突破，從AlphaGo到智慧語音助理、自動駕駛技術等，無疑捕捉了無數人們的注意力，宣告著劃時代的科技盛世已經到來。

機器學習 Machine Learning

機器學習是可以尋找適合讓電腦做預測或數學模型分類的一種演算方法。這種演算方法主要透過蒐集大量原始數據與標準答案，以訓練資料調整且選擇相應的數學模型，同時並藉由驗證資料比對計算分類結果，來判定模型是否適合用來預測或分類。

深度學習 Deep Learning

深度學習是機器學習的一種分支，也是目前機器學習發展方向的主流。其概念主要是複合多層複雜結構的人工神經網絡，並將其中函數作多重非線性轉換，使之增加高度抽象化資料、記憶資料影響能力。

自然語言處理 Natural Language Processing

自然語言處理又可分為不同的階段，包含：語音或文字辨識、自動分詞與詞性標注、語句生成與文本朗讀等。主要著重如何以電腦處理並運用自然語言，並企圖讓機器「理解」人類的語言，是人工智慧領域裡的其中一項重要分支。

		自動登錄	找回密碼
密碼			立即註冊

完全解讀：人工智慧新商業--人工智慧三大關鍵技術

相關帖子