統計與資料科學中的數學



文/王啟樺


 前言

「我不太明白你的意思。」大概是在2011年智慧型手機語音助理發布初期,使用後我們最常聽到的回答。轉眼七年過去,語音助理已能夠協助我們查詢天氣、預約餐廳、安排行程、甚至自動傳送照片和影片、語音留言給所愛的家人伴侶。是否想過,十年後的「助理」,會是什麼樣子呢?它是否可以藉由每天與我們的談話,更了解我們自身,進而提供更個人化的服務?

這一切多功能的自動化背後,藏著的是統計與資料科學中的數學。

本文以數學角度介紹統計與資料科學其背後追隨的人工智慧之夢。首節介紹最基本的自動化系統模型--智能代理人。接著闡述智能代理人探索環境與環境互動收集資訊以自動採取行動達到特定目的的回饋機制--互動學習。最後介紹互動學習四階段各自對應的科學學科--資料科學、數學、機率統計學、機器學習理論。
 
 助理的模型:智能代理人(Intelligent Agent) 

在近未來的某一天,下班後勞累的我,正打算開一瓶可樂開心一下;然而,腕上的智慧型手錶透過我皮膚上的酸鹼判斷了我的健康狀況,它阻止了我打開手上的碳酸飲料,並給出了喝熱水的建議。我放下了手中的飲料,心情低落了下來;此時智慧型手錶透過我皮膚下的溫度與脈搏察覺了我的心情,它建議我做一些重量訓練與有氧運動,完成後可以喝半瓶可樂。我想一想覺得十分有道理,便依據它的建議執行。漸漸地,我養成了健康的生活型態。

你會不會想要這樣的一個智慧型助理呢?故事中智慧型手錶背後的助理,是一個能夠察覺我當下的生理與心理狀況,進而給出當下最佳建議的自動化系統。它藉由收集我皮膚上的酸鹼與皮膚下的脈搏判斷我的生理與心理健康;藉由與我對話試著改變我的生活型態;藉由再一次收集我皮膚上下產生的資訊來記錄我是否已經養成健康的生活型態。這樣的助理,是我們人類的人工智慧之夢。構築如此之夢,數學思維將是我們一項十分可靠的建材。

為引入後續的數學原理討論,我們介紹人工智慧系統的一種基礎模型--智能代理人。歷史上,人們夢想能製造一個能夠觀察週遭環境,隨環境改變行動,以達到目的的自動化系統。智能代理人便是如此自動化系統的最基本模型。顧名思義,智能代理人包含了「智能」與「代理」兩個部分。我們說一個系統是「智能」的,如果此系統能夠以某種形式描述並理解內部系統與外部環境的差異;一個系統具「代理」性質,如果此系統能僅藉由內部運算的結果作出行動以達成特定目的。

智慧型的掃地機器人是智能代理人一個很好的具體例子。一個理想的智慧型掃地機器人,在被用戶買回家裡後,便會開始「學習」用戶的家庭環境。它有計畫地走遍用戶家中的每個角落,在內部電腦儲存家裡的模型,記錄那個角落灰塵較多,那個角落比較容易髒。在多次學習了用戶家庭環境的髒亂程度,掃地機器人優化了自己日常執行任務的效率:愈容易髒的地方,就愈經常去打掃。根據髒亂程度決定的打掃頻率,除了維持用戶家庭環境的整潔,也避免了額外無謂的打掃,因而節省能源。

如此對自動化系統的要求,源自於希望自動化系統也能夠有類似於人類的「學習」能力。人類能夠觀察外在環境與內在理解的差異,並根據當下想達成的目的,利用大腦判斷所需採取的行動。我們作為人類,學以致用似乎是很自然的能力。如何讓沒有心智的機器有這種學習能力,是現代整個世界都在研究的主要潮流。機器具有一項遠超出人類所能的巨大優勢:能夠同時執行數億次計算並且不出現嚴重的計算錯誤。試想,若機器有了與人類相當的「學習」能力,配合其同時執行大量運算的長處,似乎能夠在具體的任務上,以很短的時間就能達到人類數十年才能達到的「熟練度」,成為可靠的任務幫手和/或人類的代理人。


 現代代理人的智能機制:互動學習(Interactive Learning)
 
不曉得你有沒有注意到,我們在網路或手機上的廣告,其實跟我們的搜尋紀錄息息相關。這其實是一種「智能代理人」與「網路搜尋服務使用者」互動後,做出的行動。舉個例子,一年前筆者的父親在網路上搜尋普渡大學,隔天網路瀏覽器出現的全都是托福補習班的廣告。然而父親並沒有出國留學的打算,留學考試相關的廣告並沒有被點擊。過了一陣子,父親的瀏覽器出現的全部都是臺幣兌換美元優惠利率的銀行服務廣告。這些其實都是網路上的智能代理人從「普渡大學」這個關鍵字推測出來的用戶需求所對應的廣告。

那麼,這些「智能代理人」是怎麼做到的呢?我們介紹背後的基本機制:互動學習。首先,讓我們複習一下智能代理人的定義:能以某種形式「理解」並「描述」內部系統與外部環境的差異,並能僅藉由內部運算的結果「作出行動」以「達成特定目的」的機制。在互動學習的架構下,智能代理人的運作機制原則上是一個下列四階段的循環流程:


藉由互動學習的機制,智能代理人藉由與人們「互動」而得到回饋,並利用該回饋「修正」它的經驗,從經驗學習,成為一個更「個人化」的智能代理人。

在前面的例子中,家父在網路搜尋了「普渡大學」,相當於是對具搜尋功能的智能代理人發出回饋。此搜尋智能代理人的任務是找到符合用戶當下消費需求的產品,提供廣告賺取利潤。對於用搜尋「普渡大學」的回饋,搜尋智能代理人便猜測用戶想出國留學,於是在瀏覽器上出現了托福補習班的廣告。此時,若用戶點了廣告,智能代理人便賺取了廣告收益;反之,若用戶忽視廣告,智能代理人則「損失」了一次做對的廣告的機會。

 互動學習四階段背後的科學原理:資料科學,數學,機率統計學,機器學習理論

接著,筆者介紹上一節智慧代理人的互動學習四階段所對應的科學主題。在第一階段的「理解環境」,智能代理人需與環境互動收集資料。「資料存儲運算」與「資料分佈模式」分別為電腦科學與資料科學的研究核心。在第二階段的「描述環境」,科學之母數學與物理學於歷史上發展了眾多對自然環境以及人文社會各種行為的描述模型。我們藉由環境模型與智慧代理人行為模式之間的互動,為智慧代理人各種可能的行為模式評估風險。在「做出行為」的階段,我們在各種智慧代理人各種可能的行為模式理,利用機率統計學與運籌學的技術,找尋最低風險的行為模式。在最後「達成特定目的」的階段,我們用機器學習理論來衡量特定的行為模式,長期而言帶來的損益,以求達到風險最小原則。互動學習四階段對應的科學原理,可連結為:

1. 理解環境:電腦科學與,資料科學

2. 描述環境:數學與物理學

3. 做出行為:機率統計學與運籌學

4. 達到特定目的:機器學習理論

筆者希望藉由介紹互動學習架構及其對應的科學領域,讓有興趣的學子們規劃自己的學習內容,累積自己的數學與資訊能力,厚植與國際人才合作的硬實力。

 結語

「智慧是知識的累積,知識是發現的累積」,是筆者在思考人工智慧與數學領域體悟甚深的一句話。廣而深的數學能力讓我們有能力去發現,義務教育系統的訓練讓我們有能力將各種發現凝結成知識,而更上一層的高等教育系統讓我們能將各種體會的知識凝固成智慧。每個人都可以有很多想法,但一個想法要落實成做法,需要很強的「數學」能力。而現代的數學能力,除了利用傳統的數學符號推導,還要能操作現代的科學計算工具。筆者感謝於各個階段的教育工作者堅守崗位,為國家產業轉型的基礎耕耘;亦期望年輕學子能保持好奇的心,了解並實踐世界科學的大潮流,厚植自己的數學與資訊能力。



 
王啟樺
美國普渡大學統計系博士班研究生