關鍵技術三:人工智慧的重要應用:自然語言處理
對人類來說,如何讓這些現代自己製造出來的機器們,可以聽懂人話,並與人類「合作」,絕對是可以推動我們面對未知宇宙的重要助手。
自然語言處理(Natural Language Processing, NLP)的研究,是要讓機器「理解」人類的語言,是人工智慧領域裡的其中一項重要分支。英國雷丁大學的演化生物學家馬克.佩葛(Mark Pagel)認為,最早的一種「社會科技」是人類的「語言」,語言的發明讓早期人類部落透過新工具:「合作」在演化上占有優勢。自然語言處理可先簡單理解分為進、出計算機等兩種:其一是從人類到電腦──讓電腦把人類的語言轉換成程式可以處理的型式,其二是從電腦回饋到人──把電腦所演算的成果轉換成人類可以理解的語言表達出來。
無論是從人類到電腦,或從電腦到人類,語言處理通常都使用到我們一般學習外語所要具備的聽、說、讀、寫等技能。其中:聽與說主要使用到聽覺與發音,對電腦而言就是能夠透過麥克風「聽」到人類說話,把聽到的聲音轉成文字(這是語音辨識),或把電腦想要表達的意思轉成人類可以理解的詞句(這是自然語言生成),再用耳機或喇叭「唸」給人類聽(這是語音合成,功能通常稱作文本朗讀:text to speech)。科學家與工程師們也致力於影像文字辨識,影像來源可以是掃描完成的文件影像檔案、也可以是手機鏡頭的即時影像,目標的文字體則可以是一般鉛字印刷品或列印的文件,也可以是手寫文字(手寫文字辨識)。