臺大電機系 李宏毅副教授 人物專訪

電機四 蔡承軒

電機三 江秉城

本次訪談由電機科普Podcast頻道——未來雜貨電進行,相關節目已於上架至網路平台,歡迎讀者上網收聽。

 

李宏毅教授目前任教於臺大電機系,亦是電機系的畢業系友,他的研究領域包括深度學習、人工智慧、自然語言處理等,是國內外學術界備受矚目的頂尖學者之一。此外,李宏毅教授是網路上知名的機器學習教育者,教授的個人Youtube頻道有許多機器學習相關的公開影片,他對於推廣深度學習技術和知識的貢獻獲得廣泛肯定和贊譽。

淺談時下最夯的ChatGPT

李宏毅教授在接受訪問時,談到了最近最夯的人工智慧ChatGPT。ChatGPT是由OpenAI團隊開發的語言模型的應用,你給他一個句子,他會給你一個回應,你可以用它來進行翻譯、文法修正、摘要等等。此外,教授還提到了一個有趣的使用方法:玩文字冒險遊戲。ChatGPT會給你一個情節然後要求你做出回應,並根據你的回應給予新的反饋,而且這是一個每次玩起來都不一樣的文字冒險遊戲,非常有趣。

接著李宏毅教授解釋了人工智慧和機器學習的區別以及督導式學習的基本方法。他說,人工智慧是一個目標,它是我們期待機器可以做到的事情,而機器學習是實現這個目標的可能手段。督導式學習是其中一個方法,透過成對的輸入和輸出資料,讓機器學習如何輸出正確的結果。

他舉例說,如果你要做影像辨識,你需要提供一大堆的圖片給機器,讓機器知道這張圖片是狗、貓還是大象,這樣機器就能夠學習並輸出正確的文字結果。如果你想要用督導式學習來訓練ChatGPT,就需要蒐集大量的人工輸入和正確的輸出,例如翻譯、文字冒險遊戲或文章摘要等,讓機器學習如何輸出正確的結果。

ChatGPT之所以與眾不同,主要是因為它在叫機器做某些我們想要他做的任務之前,先做了一個預訓練,有點像是課前預習。這個預訓練,有別於傳統監督式學習需要人提供成對的資料,它可以隨便拿一個句子出來,切成兩段就可以直接拿來訓練機器。

但這也帶來了一個問題,因為這樣的訓練方式,機器學到的內容並不一定是我們想要的。比如,ChatGPT可以從網路上學到許多不正確的資訊,導致他無法回答我們想要的問題。但是,透過這種訓練方式,ChatGPT已經對人類的語言非常熟悉,並且可以輕易產生合理的句子。

而在接下來的訓練過程中,我們需要用人類作為機器的老師,告訴機器正確的、人類想要輸出是什麼。不過,人類老師提供的輸出仍然有限,因此,ChatGPT需要進一步的訓練,訓練出一個模型,取代人類的導師。透過這樣的方式,ChatGPT就可以針對每一種任務,依照少量的資料去微調一下,就可以做好特定的任務。

最後教授談到了關於ChatGPT的資料和更新的問題。ChatGPT在做預訓練時只使用到2021年的資料,因此它沒有2022年的概念。OpenAI團隊負責更新和維護模型的資料和功能,但更新模型並不是一個容易的任務,因為它可能會影響到模型的其他方面。對話中也討論了機器學習中常見的困難,當讓機器學習新的概念時,它們有可能會影響之前所學的技能。

意外成為Youtuber的小故事

李宏毅教授近年以在YouTube上的機器學習教學聞名,他在接受訪問時回憶起自己教學經驗,也分享了對機器學習的看法。教授表示自己從來沒有想過要成為一個YouTuber,這一切都是出於偶然。

教授回台大任教的第一門課是電路學,但因為對這方面不如機器學習領域熟悉,他便錄下自己的上課過程,方便自己回去思考改進。之後李宏毅教授開始開設機器學習相關的課程,當時課堂上也都有錄影。有一天學生們發現了這一點,詢問老師是否能把錄影分享出來,他也很樂意地把他的教學分享出去。

至於這些跟Youtube有甚麼關係呢?教授當初在Youtube上傳影片本來只是方便轉檔,後來卻發現觀看數越來越多。這些影片成為了網路上的熱門資源,現在也有許多人在YouTube上觀看他的課程。截至2023年4月底,他的個人頻道達到了15.6萬的訂閱數。

求學生涯與教職之路

李宏毅教授回憶起自己的大學時期,他和許多同學一樣都曾因台大電機系困難的必修課而感到沮喪。當時大一大二的他在必修課成績上並不出色,甚至有個學期差點面臨了「學籍危機」。後來他在李琳山教授的進階課程與專題中受到啟發,在找研究的題目中用自己想到的方法來解決問題。他認為找到自己的興趣和熱情非常重要,這樣才能夠持續地學習和進步。

從大學、碩博士到現在,李宏毅教授的研究領域主要是語音處理相關。他認為,語音科技可以應用在許多領域,包括語音識別、語音生成、語音合成等,未來有很大的發展潛力。事實上,在他開始進行語音處理研究的時候,語音處理還沒有被廣泛應用。他的老師,李琳山教授,在四十年前就已經在做語音相關的研究了,那個時候甚至還沒有個人電腦,但他一直堅持研究著。

問及他選擇這個方向的原因時,他表示在大學時還很迷惘,不知道未來要做什麼。當年他還是同學裡第一位買智慧型手機的,並在上面裝了一個自己做的語音系統。教授表示在選擇研究方向時,不應該只選擇當下最熱門的題目,因為四五年後,這個熱門題目可能已經不再受歡迎了。相反,選擇一個自己感興趣的題目並且持之以恆地研究是更重要的。持續學習、不斷地提升自己,為自己的人生保留更多的選擇,也為自己開闢更廣闊的發展空間。

此外,李宏毅教授的團隊在語音識別和語音生成領域上也已有許多進展。教授分享了其實驗室的研究成果以及合作情況。他提到,他們的團隊曾與Meta和Google合作,涉及語音翻譯等領域。此外,團隊還正在研究一個困難的問題:假設沒有成對的翻譯資料,機器該如何學習翻譯?他們正在研究一種類似破解密碼的方法,通過分析不同語言中最常用的詞彙,讓機器學習語音之間的連結關係。如果缺乏成對資料,就需要探索新的方法,讓機器能夠自動學會語音轉語音的翻譯。

受訪時,教授也談到了自己回臺大任教的初衷,是為了感謝母校曾經的栽培,也對回臺大任教充滿期待。教授的工作是非常忙碌的,因為他們需要兼顧教學、研究、服務等不同面向,並且對象包括學校、台灣社會以及國際社群。教授的身份是非常多元的,一方面要帶領學生一起前進,另一方面也要面對產學合作、科技部計劃等工作。他表示教授的定位其實很模糊,就像一個小公司,需要有一個領隊帶領員工完成使命。「企業是KPI沒達標的人離開,實驗室卻是KPI達標、完成任務的人離開」李宏毅教授打趣地說。

與時俱進及面對挫折:每個人的人生課題

教授回想起2015年開始教授深度學習時的情景,當時還沒有現在廣泛使用的TensorFlow。如今,隨著深度學習技術的不斷發展,李教授提到,在未來5年10年中,肯定會有更多的新技術出現,因此,對於學習者來說,持續學習的心態非常重要。

大學時期的學習往往是從教科書中學習,但在未來的研究中,你會遇到許多最新的學問和技能,它們可能還沒有教科書。因此,學習如何快速學習一門新的學問或技能,是一種非常重要的能力。在電機領域,這種能力更是非常重要。科技日新月異,不斷涌現的新技術和新學問需要我們不斷學習和掌握。在教職、研究或業界中,擁有這種能力會讓你更具競爭力。

然而對於學習者來說,如何對抗挫折也同樣重要。李教授認為,每個人都會在人生中經歷挫折,而如何處理這些挫折,是一個人成長的關鍵。他舉例說,當一個學生從高中考上大學後,可能會發現自己不再是班上或全校最強的學生,這時他需要學會如何處理失敗和挫折。在機器學習的學習過程中,很多人也會碰到投入長時間與資源,最後結果卻很差的情況。學習如何面對挫折,是一種非常重要的能力,而這種能力也會使你一生受用不盡。

蔡承軒,電機系大學部學生。電機科普Podcast頻道未來雜貨電創辦人&負責人。

江秉城,電機大學部學生,未來雜貨電節目主持人。