自然語言是為現今人工智慧所著重的領域之一,其目標是要讓機器如同人類一般擁有聽說讀寫、理解語意、溝通交流,甚至有能力去產生詩詞文學、故事等更加進階的語言結構。而其中含有多個技術層面,從小至字詞特徵的汲取與判別,各種理論和語意模型的建立,大至語音辨識、文意與情感理解、語句文本分類、文句生成等等。
針對此領域,機器學習,尤其是深度學習,是目前最常採用的方法,WordToVec、語音辨識、語句問答,機器翻譯都是運用深度學習的方法,並且一舉突破過往只延伸基本機器學習的方法所產生的結果,因此深度學習將為本領域所廣泛採用,而本實驗室也與時俱進,採用近年來各國期刊上最前端的技術來應用在多種層面上應用。
目前實驗室的研究內容著重於三個部分:
- 電腦說故事 :以AlphaGo所採用的Monte Carlo Tree Search為方法,ConceptNet為故事素材資料庫,Fabula Model為故事生成基幹來產生故事,並延伸Deep Learning為輔來強化故事結構的穩定度。
- 語音辨識:以目前較新的Deep Learning模型以及本土電影為資料,應用於國語、客語、臺灣國語等本土語言的辨識。
- 語意理解及問答系統:應用Memory Network及SequenceToSequence Model來抽取並紀錄問題特徵,並用記錄的特徵來找出最適合的解答。
- ChatBot:應用於語音客服中,由大量客服的應答中訓練出問答機器人,結合語音辨識、語意理解和文字轉語音,藉由一問一答中得到詢問者所提供的資訊。