千人創新課程-機器學習課程

李宏毅

隨著人工智慧技術的發展,其核心技術—機器學習(Machine Learning)—逐漸被各行各業所重視,需要學習機器學習技術的學生不再限於電機資訊學院,而是橫跨各個科系,因此本系李宏毅教授所開授的《機器學習》這門課在109年下學期開放讓台大所有科系的學生都可以修習,本課程修課人數多達 1280 人。

圖一、實體教室上課情形,課程同時提供線上直播,所有上課內容都有錄影,學生也可以選擇課後觀看

千人大班要怎麼上課?

上千人的課程光是要找教室讓所有人都可以聽課就是個大問題,因為就算是台大最大的教室也無法容納上千位同學,所以李教授在規劃課程時就是以讓學生可以完全在線上學習為目標,除了實體課堂外,課程有同步直播,同學們可以自由決定要現場聽課還是線上聽課,上課的內容都有錄影,學生也可以選擇課後觀看,所有的上課錄影都可以在李宏毅教授的 YouTube 頻道上找到:https://www.youtube.com/c/HungyiLeeNTU/。在5月疫情爆發後,台大停止實體授課,但因為這門課本來就是以可以線上學習為初衷來規劃,所以並沒有受到疫情太大影響。

圖二為李教授的《機器學習》本學期修課學生系所分布,由圖中可以看出修課學生的來源非常廣泛,為了讓上千位不同程度的同學都能夠透過這門課程對機器學習有初步的認識,李宏毅教授對本學期課程的規劃煞費苦心。在教材和作業規劃上李宏毅教授表示他的目標是「雅俗共賞」,希望只要有基本程式能力的學生都有機會可以透過這門課認識機器學習,但同時這門課對電資學院的學生仍具有一定程度的挑戰,因此作業都有助教的範例程式,按照助教手把手的指示修改範例程式可以拿到基本分數,但同時在作業中也設計了很多難關,等待想要深入研究機器學習的同學們來挑戰,所有的作業都可以在以下課程網站上找到:https://speech.ee.ntu.edu.tw/~hylee/ml/2021-spring.html

圖二、修課學生系所分布

中文課程和英文課程任君挑選

過去台大為了照顧外籍生所以開授了很多英文的課程,英文課程雖然照顧了外籍生,但是本地生在英文課程上的吸收往往不如中文課程,怎麼魚與熊掌兼得呢?李教授的課程錄影同時有中英文兩個版本,讓外籍生和本地生都可以各取所需,他是如何做到的呢?

本學期的助教團隊做了別開生面的嘗試,他們先把李教授的上課錄影聽打出中文字幕,將中文字幕翻譯成英文字幕,最後使用語音合成系統念出英文字幕的內容,再嵌回課程錄影中,如此就可以製造出英文的上課影片,助教團隊建立了一個有效率的流水線,可以在一周內把三個小時的中文課程轉成英文課程,英文課程品質聽起來如何呢?請看以下例子

中文課程:https://www.youtube.com/watch?v=wulqhgnDr7E

由中文課程轉出的英文課程: https://www.youtube.com/watch?v=6xRAiKAYPxU

 

自助餐式學習

本學期的上課內容廣泛,既有基礎的知識也有前沿的研究,李宏毅教授不只是講授機器學習的基本觀念,還用初學者也可以了解的方式講授前沿的研究。作業內容安排也非常多元,囊括多個專業領域,如Covid-19趨勢預測、影像辨識、中英翻譯、語音辨識、語者辨識等等,讓學生學習將機器學習技術使用於實際應用上,作業的內容還包含了近幾年最新之機器學習技術,例如:自督導式學習(self-supervised learning)、元學習(meta learning)、終身學習(life-long learning)等等。

所有的作業都是線上完成,學生只要線上繳交程式以及模型跑出來的結果,就可以得到分數,因為修課人數眾多,所以模型結果的評估都全面自動化,有些作業可以用現成的平台,例如: Kaggle ,來評估模型跑出來的結果,但是也有一些創新的作業,需要用到助教團隊自行搭建的平台,例如:對抗式攻擊(Adversarial Attack)作業的目標是要讓同學們在圖片中加上雜訊以騙過機器學習得到的影像辨識系統,藉此同學們可以了解今日機器學習系統的脆弱性,在該作業中,助教團隊就需要線上搭建自己的影像辨識系統,讓同學們上傳圖片去欺騙該系統,這就需要用到自行搭建的平台,沒有現成的平台可用。

因為想要傳遞給學生的資訊量非常巨大,所以這門課有十五個作業,但是另外一方面因為要完成所有的作業在一學期內幾乎是不可能的,所以修課學生只要選擇十個有興趣的作業完成就可以拿到所有的分數,由學生自己決定在這門課中要學到甚麼知識,李教授把這樣的學習方式稱之為「自助餐式學習」,但為了鼓勵同學完成所有的作業,十五個作業都圓滿完成的同學李教授會送他課程專屬的 T-shirt (圖三)作為獎勵,最後 1280 位同學中有 17 位同學獲得獎勵。

圖三、課程專屬T-shirt 設計圖

結語

最後李宏毅教授也分享了他開授這門課的心得:「一開始我其實非常猶豫要不要開放讓《機器學習》變成千人大班,讓全校同學都選修,因為我知道我將面對過去從來沒有遇過的問題,但想到可以讓本來不可能修到這門課的同學修這門課,他們可能在未來將機器學習的技術用於我無法想像之處,進而造福這個世界,最後我決定接受這個挑戰。」

李教授再進一步補充:「事實上,在授課過程中真的有很多難題,例如:訓練某些機器學習的模型往往需數日之久,雖然在最初設計作業時已經進行簡化,在不失作業想要傳遞的知識的前提下,讓模型的訓練減低到數小時,但當有些同學發現模型的訓練需要數小時的時候,仍感到衝擊巨大,因此期中在不調整作業難度的前提下,授課教師和助教團隊採取了各種措施,試圖減少修課同學面對的衝擊。在這門課中,老師、助教團隊、學生三方都受到全新的衝擊,而透過這些寶貴的經驗,我相信大家都有了成長。」

李宏毅教授個人網頁   http://speech.ee.ntu.edu.tw/~tlkagk/