0
雷鋒網(wǎng) AI 科技評論按:9 月 21 日至 22 日,為期兩天的 CCAI 2019 正在秋意濃濃的中國青島膠州隆重舉行。本次會議選址室外體育館召開,為原本嚴肅的學術會議增添了幾分活潑、愜意的色彩。

CCAI 2019 會場外景
會議第二日,徐宗本院士作為首位演講嘉賓,從他的數(shù)學專業(yè)出發(fā),慷慨激昂地為大家?guī)砹酥黝}為《AI 與數(shù)學:融通共進》的報告。
在開場前,他先從徐匡迪之問——「人工智能的基石在數(shù)學,我們有多少數(shù)學家投身進去了?」以及任正非答記者問時強調(diào)「人工智能的本質(zhì)就是數(shù)學」的觀點引入,表達了自己對于人工智能與數(shù)學之間的關系的看法:融通共進,一方面,人工智能的基礎之一是數(shù)學,因此人工智能想要行穩(wěn)致遠,就必須先把數(shù)學的基本問題解決好;另一方面,人工智能的發(fā)展也對數(shù)學領域的研究產(chǎn)生了重要的推動作用。

在本次報告中,徐宗本院士重點分享的內(nèi)容包括四個部分:第一,為理解人工智能和數(shù)學之間的關系提供一個框架,闡述數(shù)學方法與人工智能方法在處理問題的方法論上存在著本質(zhì)上的一致性,因而二者能夠「融通」;第二,從數(shù)學維度指出人工智能在目前發(fā)展中所存在的幾個關鍵問題;第三,展示人工智能為數(shù)學研究所帶來的新的方法論;第四,為人工智能與數(shù)學的融合方式提出具體方法。
與此同時,徐宗本院士也指出,本次他演講中提到的「人工智能」,主要是指機器學習,雖然這只是人工智能的一部分,但是就他看來,是最能夠直接成為生產(chǎn)力并且也是非常重要的部分。
一開始,徐宗本院士對機器學習的基本概念進行了解釋,他表示,簡單而言,智能就是模擬人的一種行為或者說能力,即在給定環(huán)境中,能通過與環(huán)境的交互和自行來提高自身解決問題的能力,而采用一個機器或者軟件來模擬這種智能時,就是機器學習。從數(shù)學的維度而言,機器學習表示的是一個函數(shù)空間或參數(shù)空間的優(yōu)化問題。

他認為,無論是從機器學習還是數(shù)學,二者在解決問題上都可以用上圖中的這一框架來描述,其中包括兩個最為重要的部分:一個是智能體,一個是環(huán)境。
智能體:它是指一個含參數(shù)、可調(diào)節(jié)的任務求解器,其形態(tài)可以是深度網(wǎng)絡,也可以是機器人、無人系統(tǒng)或者一個算法。
環(huán)境:這里所說的環(huán)境一定有兩個基本性質(zhì):第一,環(huán)境是可以描述的,如果用數(shù)據(jù)來描述就是人工智能方法,如果用模型來描述就是數(shù)學方法或物理方法,如果是用知識來描述的就可能是知識工程方法等等;第二,環(huán)境是可以對其進行建模的,能夠借以對智能體的行為作出判斷,即可作為修正智能體行為的指標。
「具備這兩個基本性質(zhì)的環(huán)境加上智能體,組成的統(tǒng)一體便叫做機器學習系統(tǒng),這其實就是我們研究問題的基本方法論?!?/p>
接下來,徐宗本院士也介紹了機器學者的幾個典型模型,包括:
第一,深度學習。所謂的深度學習就是指輸入一個數(shù)據(jù),然后得到一個依賴于數(shù)據(jù)的預測或者是判斷,它的環(huán)境是有標簽的大數(shù)據(jù),同時其應用的基本前提是有原因或結果組成且量很大的有序?qū)Α?/p>

第二,自編碼器。當下這一代的人工智能就在于特征表述,這就涉及到自編碼器這項重要的技術。編碼器的任務就是提取數(shù)據(jù)的內(nèi)涵特征,可以用來實現(xiàn)降維等任務。它的環(huán)境是無標簽的數(shù)據(jù)。

第三,對抗生成(GAN)。大數(shù)據(jù)不夠是大數(shù)據(jù)領域的常見問題,而對抗生成便是使用網(wǎng)絡生成一些數(shù)據(jù)的模型。它的環(huán)境是沒有標簽同時量也很小的小數(shù)據(jù),不過這些數(shù)據(jù)都是比較準確的,也就是我們所說的原數(shù)據(jù)。

第四,強化學習。強化學習時該研究領域常用的模型,它要解決的是需要對最終的決策負責的場景,比如智能駕駛需要在當下時刻知道下一步怎么走,比如說在下棋的時候也要知道走了這一步后,將對將來的勝負產(chǎn)生多大的影響等等。它的環(huán)境不一定是數(shù)據(jù),比如說自動駕駛的環(huán)境就是各種傳感器對身處環(huán)境的描述。

「那在這些模型中,數(shù)學和物理充當什么作用呢?以上圖強化學習為例,智能體就正在解決一個數(shù)學問題,此刻它的環(huán)境就是給定的數(shù)學公式、定解條件或邊界條件等。因此從本質(zhì)上來看,人工智能、知識工程以及數(shù)學在解決問題時所使用的基本方法論其實是具有統(tǒng)一性的。」
目前,人工智能已經(jīng)經(jīng)過了「從一個不可用的技術發(fā)展到一個可應用的技術」的拐點,其原因有三:一是有了大量有標簽的大數(shù)據(jù);二是出現(xiàn)了像深度學習這樣的標準模型和算法;三是擁有了強大的計算力,例如超算和云計算。

對此,徐宗本院士指出,在欣喜人工智能變成可用技術的同時,我們必須冷靜地看到,目前我們距離人工智能的真正產(chǎn)業(yè)化,真正能把人工智能技術用得明白、也用得好,仍然還有很長一段路要走。以機器學習為例,從數(shù)據(jù)層面上講,我們還需要使用大量的人工去標注,去選擇樣本;從應用層面而言,還需要自己去搭建不同的神經(jīng)結構,去選擇不同的訓練算法,因而在現(xiàn)階段,我們還處于一個「用多少人工換來多少智能」的人工智能階段。
而要想從「可以用」走到「很好用」則還存在很多技術挑戰(zhàn):首先在數(shù)據(jù)樣本層面上,數(shù)據(jù)樣本需要實現(xiàn)自生成、自選擇;其次在模型算法層面上,模型算法需要實現(xiàn)自構建、自設計;最后在環(huán)境任務層面上,環(huán)境任務要實現(xiàn)自適應、自轉換。
「我們將實現(xiàn)了以上三個方面的六個特征的人工智能叫做機器學習自動化,這是我?guī)ьI的研究小組這幾年在主攻的方向。關于大家問到人工智能未來的發(fā)展方向,我們不妨以實現(xiàn)共產(chǎn)主義來做類比:我認為人工智能的共產(chǎn)主義目標是自主智能,然而在實現(xiàn)共產(chǎn)主義之前我們必須先走過社會主義初級階段——機器學習自動化便是社會主義初級階段目標。所以說,人工智能的發(fā)展軌跡應該是從人工走向自動化,再邁向自主智能。」
第一,大數(shù)據(jù)的統(tǒng)計學基礎。人工智能應用的基本模式則包括感、知、控三個部分,其中,感,就是將環(huán)境中的各種要素通過各種各樣的傳感器變成數(shù)據(jù)的數(shù)字化過程;知,就是指能讀懂大數(shù)據(jù),這是機器學習的主要部分;控,則是指機器將由數(shù)據(jù)得到的知識和規(guī)則用于實際控制。貫穿著三個基本模型的核心技術便是大數(shù)據(jù),而統(tǒng)計學則是理解、分析大數(shù)據(jù)的基礎。目前,支持大數(shù)據(jù)分析的數(shù)學基礎尚未完全建立起來。

第二,大數(shù)據(jù)計算基礎算法。大數(shù)據(jù)一般應用于分析處理兩類基本任務:一類是以計算機邏輯為基礎的搜索、比對、排序、溯源等問題;一類是分析數(shù)據(jù)之間是否具有共性結構等的聚類、分類、回歸等問題。這兩類問題都以數(shù)學模型為基礎。然而一些傳統(tǒng)的計算,在大數(shù)據(jù)環(huán)境下都變成了全新的問題,因而針對大數(shù)據(jù)環(huán)境重建大數(shù)據(jù)計算的基礎算法和分析處理算法,都成為當下亟待解決的問題。

第三,深度學習的數(shù)學原理。「深度學習現(xiàn)在存在很多毛病,張鈸院士昨天也說過了,然而深度學習是目前最能夠為大家所普遍接受的人工智能技術之一,就像高考,雖然被人詬病很多,但是目前還沒有更好的方式來替代它一樣,深度學習同樣如此。比如它存在的可解釋性問題,主要還是因為它無法使用明確的數(shù)據(jù)公式來進行展開,因而如何從數(shù)學上證明深度學習在每一層網(wǎng)絡上的展開情況,是當下迫在眉睫的事情;另外,什么樣的結構決定什么樣的性質(zhì),因而我們還需要研究清楚深度學習中結構和性質(zhì)的關系問題。

第四,非常規(guī)約束下的輸運問題。人工智能的很多問題都可以抽象為:將一個領域的數(shù)據(jù)轉移到另外一個領域的數(shù)據(jù),比如說機器翻譯,就實現(xiàn)不同語言之間的轉換問題。這自然就涉及到「什么樣的數(shù)據(jù)之間能夠進行轉移」的問題。而眾所周知,能夠?qū)崿F(xiàn)轉移的前提是,兩個領域之間的數(shù)據(jù)存在一「公共不變量」,這是數(shù)學的標準術語。比如說機器能翻譯就存在語義這一不變量,例如醫(yī)療應用同樣遵循這一思路,即 CT 圖象轉成核磁圖象過程中,同一個人本身就是就是這個不變量。如何判斷數(shù)據(jù)能夠被轉移,以及如何實現(xiàn)不同領域的數(shù)據(jù)轉移問題,就叫做非傳統(tǒng)約束下的傳輸問題。

第五,學習方法論的建模與函數(shù)空間上的學習理論。目前機器學習所處的階段是:數(shù)據(jù)是中心以及機器學習和泛化的對象。這就要求數(shù)據(jù)對問題具有普適性、可推廣性以及學習性,數(shù)學中對此的一個提法是學習方法論或者說函數(shù)空間上的學習理論。在邁向機器學習自動化之前,就必須使其具有對相關問題的公共方法論的學習,然而目前這還是一個全新的研究領域,暫時還沒有出現(xiàn)相關的研究框架。

「這五個問題是通向自主智能鎖必須解決的基本問題,而這也反過來說明了為什么我們都說人工智能的基石在數(shù)學的原因?!?/p>
數(shù)學對于人工智能的基礎性作用不言而喻,而反過來,人工智能技術同樣也為數(shù)學領域的研究帶來了全新的視角,并帶來了一些革命性影響。徐宗本院士主要基于人工智能為優(yōu)化、PDE 問題的數(shù)學研究所帶來的推動作用,進行了該部分的介紹。
AI 對優(yōu)化的應用

最優(yōu)化是數(shù)學的基本問題,然而數(shù)學傳統(tǒng)在研究這個問題上有很多的局限性,包括無法實現(xiàn)全局優(yōu)化、不涉及超參數(shù)問題以及適配性問題等,例如在局部優(yōu)化方面研究得很徹底,但就是沒有人研究解決某個「世紀」問題應該用什么方法。而人工智能在這幾個問題上的應用,都能帶來非常可喜的結果。
徐宗本院士表示,人工智能對優(yōu)化問題的研究帶來了全新的思考,對此他提到了三個案例:
第一,解決適配性問題。「Learn to Learn」這個方法最早出現(xiàn)于 2006 年,隨后就一發(fā)不可收拾地出現(xiàn)了很多技術,包括「學會搜索」、「學會 teach」、「學會推理」等以「學會」為主體的推理方法。這類方法都是從宏觀學習方法論的角度解決問題,基于這些方法,現(xiàn)在我們已經(jīng)有了一個對任意優(yōu)化問題都可用的自適應優(yōu)化器。

第二,解決超參數(shù)問題。以壓縮感知問題為例,下圖為壓縮感知的基本框架。公式中,第一項是擬合項,現(xiàn)在采用人工智能技術以后,可以在公式中將超參數(shù)作為參數(shù)使用,對照著問題去訓練,能夠一次性地把壓縮感知的選擇問題解決,該方法尤其是在圖象處理、醫(yī)療成像等應用中,都是實現(xiàn)了目前性能最好的神經(jīng)網(wǎng)絡模型。

第三,解全局優(yōu)化問題。全局優(yōu)化問題一直以來都是個難題,但如果從強化學習的視角來解決這個問題,它的面貌就會煥然一新。比如在 MNIST 手寫數(shù)字識別中要解決 7960 維的優(yōu)化問題,就可以使用全梯度下降方法來進行優(yōu)化。

AI 對 PDE 問題的應用
而人工智能對 PDE 問題的應用,同樣被徐宗本院士視作人工智能在數(shù)學中的成功應用。下圖中公式為 PDE 的一般形式:第一行方程式是含導數(shù)的關系式;第二行方方程式則是指該函數(shù)應該滿足的初始條件;第三行方程式方式則表示公式在邊界情況下的對應關系。三個方程式合在一起就是微分方程定解問題。

對此,數(shù)學家已經(jīng)提出了有限差分法、有限元法、有限體方法等等,都很成功,然而不得不承認的是,在解決復雜邊界以及復雜的函數(shù)時,這些方法的效果并不好。而人工智能則為這一問題提供了一個全新的視角和完全不同的解決方向,即利用對空間的采樣即積分方法來提到離散化的微分方法。
對應人工智能的框架來說,即可以將智能體理解為找微分方程解,環(huán)境就可以理解為上面方程式給出的初始條件和邊界對應關系?;谶@種方法,最終能夠讓神經(jīng)網(wǎng)絡逼近微分方程的解。
同時,徐宗本院士還特別介紹了 AI 在反問題中的應用。他指出,反問題是 CT、核磁共振、雷達等應用的基礎之基礎,都是根據(jù)已知的東西推理未知的東西,而如果將這些問題改造成神經(jīng)網(wǎng)絡的話,就能帶來意想不到的效果。
首先是受到編碼器的啟示,他對自編碼器提供的「黑箱」編碼、解碼以及數(shù)據(jù)編碼、解碼的方法進行改造,提出了模型驅(qū)動、機理溶入的反問題求解框架,并由此提出解反問題的無監(jiān)督學習、全監(jiān)督學習和半監(jiān)督學習的三種模式都采用這一框架去實現(xiàn)的觀點。

其次在解線性方程組的應用上,此前,Y=aX 作為線性方程組的基本公式,我們一定需要知道 a 的具體值以及是否可逆的等等。而現(xiàn)在深度學習則能夠做到「不問東西」、「不問青紅皂白」地直接給出解。

另外在地震波反演的應用上,在使用人工智能方法后,地震勘探不再只是單純解偏方程數(shù)字解,最終更能夠「看清楚」地底下的情況。

演講最后,徐宗本院士還對 AI 與數(shù)學未來的「融合共通」發(fā)展進行了展望,提出了具體的研究方向。他指出,從認識論和方法論上來看,數(shù)學與 AI 交互作用的本質(zhì)是提倡「模型驅(qū)動」與「數(shù)據(jù)驅(qū)動」的結合,而這種結合具有巨大的潛力,其中具體的結合方式包括:?
第一,數(shù)據(jù)不夠模型補,模型不精數(shù)據(jù)上。「這句話,這兩年我說過很多次,現(xiàn)在我越來越覺得這兩句話很對。一方面,當我們抱怨數(shù)據(jù)不夠時,我們還可以想想我們在幾十年的研究中已經(jīng)積攢了很多模型,并且模型就是數(shù)據(jù)的升華,因而用上一個好的模型可以大大減少對數(shù)據(jù)的依賴性;另一方面,模型好自然很好,然而當無法實現(xiàn)一個精致的模型時,我們還能夠用數(shù)據(jù)去補,實際上現(xiàn)在在很多科學研究中,研究者們都在用數(shù)據(jù)彌補模型上的不足?!?/p>
第二,物理機理啟發(fā),知識融入。「這同樣也是極為重要的科學方法論,是我們可以用來提高解決問題的質(zhì)量以及人工智能效能的重要法寶?!?/p>
大會首日,雷鋒網(wǎng) AI 科技評論也在現(xiàn)場為大家?guī)砹藦堚撛菏康难葜v報道《張鈸院士:人工智能的魅力就是它永遠在路上 | CCAI 2019 》,大家可前往查看。 雷鋒網(wǎng)
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權禁止轉載。詳情見轉載須知。