撰文:王新博(臺大電機系教授)
我是 B00 的王新博,十三年前在臺大讀數學,中間去伊利諾大學攻讀博士,再過了兩個博後後,很榮幸可以進臺大電機系任教。
我的研究興趣在編碼學與消息理論這一塊。編碼學類似密碼學,都是將訊息在一端編碼之後,傳到另一端解碼。不同的是,密碼學側重防止訊息被壞人窺探,編碼學則更強調資訊不應被大自然破壞。乍看之下,好像編碼更單純一點,但經過八十年無數人的迭代改善後,我們對於「好的通訊系統」有非常嚴格的要求。為了滿足高速、低錯誤率、省電等種種需求,編碼理論向數學家借了很多優美的概念與理論,如隨機過程、代數幾何等。頂尖的會議、期刊,甚至會逐行檢查論文裡的數學證明,否則無法放行這個「定理」。像這樣子寫證明與檢查證明,便是我的工作內容。
通訊理論在最近這十五年,有兩個非常重要的突破。分別是極化碼 polar codes 與低密度檢查碼 LDPC codes 在一對一通訊時,可以「無限逼近」夏農極限。我們知道,3G 標準裡的渦輪碼 turbo codes 僅僅只是「很靠近」夏農極限而已,到了 4G 時代便換成了可以無限逼近的 LDPC codes,5G 就更進一步,把 polar 與 LDPC 都納入標準之中。若近期沒有出現其他更有競爭力的碼,6G 的制定將會圍繞著 polar 與 LDPC 展開。這兩個碼的理論,尤其是短碼長 short block length 的面向,都非常依賴我們對隨機過程與動態系統的理解。屆時歡迎有興趣的同學、同事一起討論。
另一個我也感興趣的題目是雲端儲存。不同於通訊是將訊息從 A 地傳到 B 地,儲存是指將資料從 A 時傳到 B 時。在中間的任意時間點,我們可以適時地檢查資料有無損壞,有的話便修理它;只要修得比壞得快,資料就可以永久保存,這便是再生碼 regenerating codes 的核心原理。若更看重使用者取用資料時,要盡可能地將負荷分散到不同伺服器,則屬於局部復元碼 locally recoverable codes 的範圍。(此處的 recover 字面上指將損壞的資料修好,但更接近其脈絡的解讀是,將分散在數個伺服器的片段恢復成使用者索取的資料)。再生碼與新復元碼的研究用到大量的代數、代數幾何、與些許數論,隨著近年來資料量指數成長,我們會用到更大更複雜的有限體 finite field,更有挑戰性,但是預期的表現也更好。