西宁沐足都有什么服务

楊學山:走向通用人工智能

2019-08-19 21:55:17

來源:CIO時代學院

  2019年8月16日至17日,由中國新一代IT產業推進聯盟指導,CIO時代學院主辦,CIO時代APP承辦的"第五屆中國行業互聯網大會暨CIO班14周年年會"在北京隆重舉辦。北京大學兼職教授、工業和信息化部原副部長楊學山發表了題為《走向通用人工智能》的演講。以下為演講實錄:
 
\
北京大學兼職教授、工業和信息化部原副部長   楊學山 
 
  尊敬的各位來賓、各位CIO的同仁,各位朋友,大家上午好!很高興參加第五屆中國行業互聯網大會暨CIO班14周年年會!CIO班14年的學員們像一顆顆種子在全國各個地方和各個行業開花結果,所以我在此表示祝賀!
 
  根據會議安排,今天講講通用人工智能。我本人是不太喜歡通用人工智能(AGI)這個詞,所以在我的書里面,沒有用到這個詞。但是大家對這個話題感興趣,而且這個概念大家也都熟悉,所以還是用這個概念來講。講三個部分:一是講歷史,我們對通用人工智能的追求;二是講一下人類智能,因為通用人工智能必須理解人的智能,不理解的話做不出來;三是講一下通向AGI的一種路徑,這個路徑就是我從《論信息》到《智能原理》到現在正在寫的第三本書《智能工程》,一直想描述的一個理論和一種實現方式。
 
  維基百科關于AGI這一段英文大概是三個意思。第一,通用人工智能是什么?通用人工智能就是能夠完成一個人所有智能行為或者是智能任務的一個機器系統;第二,它既是人工智能研究者,也是我們寫科幻小說的人和未來學研究的人共同使用的一個概念,這句話很有意思;第三,通用人工智能和其他相關的幾個智能概念的關系。
 
  確實,我們人類對通用人工智能的追求有著漫長的歷史。萊布尼茨應該說是我們走向機器智能的一個奠基者,他是二進制創造者,是符號思維符號邏輯的創立者,也是機器思維的創立者。所以應該說從他開始往后,我們在持續追求一種機器,這種機器能夠像人的思維,有人一樣的智能。
 
  在這個過程中有很多的努力,但是很多都失敗了。其實前面兩個我們都熟悉,通用問題求解器,五代機誰也知道,當然美國國防部的DARPA項目我們了解的不多,但是它也是想追求通用人工智能,但是他也失敗了。
 
  盡管萊布尼茨1640年前后到現在350多年了,我們依然沒有找到解。這里面有說人工智能不可能在近期有重大突破的這樣一些觀念,這是左邊。右邊講的是為什么通用人工智能不行,主要的反對意見,所以說我們到今天為止沒有找到解。
 
  盡管沒有找到解,但是努力依然沒有放棄。到現在,大概全世界還有40多個項目在做著通用人工智能,都在進行中。美國2019年的人工智能戰略里面,六項任務中的第四項依然是要找通用人工智能究竟怎么實現。所以還有40多個項目在今天依然活躍在通用人工智能領域,但是十分遺憾的是,所有的這些項目到今天為止,連他們自己在內都不可能認為他已經找到了走向通用人工智能的路。只是說他們在努力,沒有放棄。
 
  原因就在于我們所有的通用人工智能的努力,都沒有真正把人的智能究竟是怎么回事兒弄清楚。維基百科的定義很清楚,通用人工智能就是一個機器系統,能夠完成一個人所有的智能行為,能夠成功地完成所有的智能行為。這個定義告訴我們要追求的目標本身就應該是如何理解人的智能,然后才說通用人工智能怎么做。人的智能是怎么回事兒?我們確實自己不了解自己。我始終說,我們最不了解的是自己,知己知彼百戰不殆,其實最難的不是知彼而是知己。幾乎所有的失敗,找找原因幾乎都是自己是主要原因。
 
  怎么理解人類智能呢?要有很多維度。第一個是多樣性,這是教育學和心理學的研究成果。人的智能是有多種類型的,代表人物是加德納,《多元智力理論》,有中譯本,你們可以看一看。他根據智力與大腦的關系及在人類知識和實踐體系中的不同部分將智力分為9類:語言、音樂、邏輯和數學、空間、體能、人際、內省、自然、存在。這本書第一版提出來了七個,到第二版再版時在前言里面加了第八個。他在20年后的一篇論文中加了0.5個,存在。他自己都沒有確定這個存在究竟算不算,所以這是多樣性。智力和智能是同一個英文字,只是在不同的語境下翻譯成智能或者智力,但英文詞是統一的,所以我們說人的智力是不同類型。為什么心理學和教育學要研究它呢?說明我們人的不同類型的智能或者智力它是有不同方式的。所以今天始終以為智能就是邏輯和數學,這確實是我們認識人工智能到今天最大的困難。以為數學和邏輯是智能,其他的都是在數學和邏輯之上建立起來的,其實不是。
 
  想想我這一輩子走過來,數學什么時候用的最多?小學、中學、大學。大學之后走向工作單位,數學用的越來越少,幾乎不用。到超市去買東西,你不算帳,你現在可以自己結賬,掃一下就OK了,所以不計算。即使在人的智能任務中,數學計算的任務是很少很少的,而且人的計算能力是極其弱的。我們很多人兩位數的加減法都想用筆算,都想用計算器,所以說明我們的計算能力有多弱,更不用說算法了。想什么呢?你怎么可能做得到?
 
  第二個發展性,人的智能是逐步發展起來的,不是一開始就十分完善。所以這是我們的心理學,特別是發展心理學研究的成果。皮亞杰是著名代表人物,所以從胎兒開始,受精卵第三周開始就開始智力發育,一直到成為社會的獨立主體,我們才開始行使我們的能力、責任。
 
  第三個結構性,這個結構有時空兩個概念。發展心理學就是一個人在你的一生中,不同的時期對不同的智能敏感,這是發展心理學的主要成果。其實還得看時間,我們的智能是一代一代傳下來的,而不是一個時間平面。就是你的一輩子不是你的一輩子,而是說一代一代傳下來的,同時它的空間結構是所有的智力,它在人的所有的認知功能體系的結構中是穩定的,從感知到傳輸到腦的記憶和使用,它都是固定的結構。這個固定的結構是生下來就有的,結構之間的關系,結構之間哪個先啟動哪個后啟動都是生下來就已經定了。
 
  再就是遺傳和生命。正因為它有時空結構,所以遺傳和生命是人的智能的重要構成部分,沒有遺傳、沒有生命、沒有智能。遺傳是從什么時候開始的?不是你父母的過程遺傳了你,而是你遺傳了從人類生命的第一個生命開始,所有的基因都在這個遺傳過程中。所以我們才說人的基因原來和一條小蟲子、一個細菌、一頭豬、一個猴子的有如此多的基因相象性。當然這還不夠,為什么還不夠?因為我們今天所謂的人類的基因組的研究只是解釋了在一個人生命過程中使用的2%的基因,還有98%所謂的暗基因或者不活動基因還沒有研究。如果再把這98%沒研究的基因放進去,就知道幾乎40億年來進化的都在基因中成長。所以遺傳和生命是理解人類智能的重要內容。
 
  這一點是我們計算機界最大的錯誤。計算機界以為信息是符號,所以機器學習、深度神經網絡努力想盡一切辦法把符號變成含義。其實這是跟人的智能相比,這是錯得離譜。因為人從一開始感知信息開始就是含義的,不是符號的。所以不管是很多聽到、眼睛看到、鼻子聞到這些感覺到,所有的從一開始都是通過特定的細胞結構來確定是什么東西,然后經過一個結構化的整合和傳輸過程到大腦里面,所以你感覺到痛就是痛、冷就是冷、熱就是熱,看到的這個光就是這個光,這個東西就是這個東西,沒有計算過程,沒有任何計算過程。這是我們的神經系統。所以人所有的信息都是含義的,絕不是符號的。符號是在人生活和發展過程當中為了交流所以才有了語言有了符號,有了符號大家相互之間都是知道的,大家知道這個東西是什么含義,但是這中間進行記錄以后,但是別人不知道,所以就有了重新認知的過程,然后我們的計算機學家以為信息是符號,其實錯了,信息它的根本是含義而不是符號。
 
  我們把一代一代的知識通過學習過程來積累到今天的大腦里面。所以往前推一千年、三千年,你得到的知識和能力是不一樣的。同時他是從胎教開始,一直到我們工作過程都是持續的交互過程。
 
  同時我們再把這樣的東西合起來看到,人的智能一個重要的特征就是主體性(意識、自我、存在、生命),沒有存在、沒有生存,哪有智能。沒有自我保護,智能就玩完了。生物進化的第一要義是生存、自我保護。在這樣的過程中,我們才有了意識、自我。自我和意識不是人獨有的,是生物在長期進化過程中逐漸逐漸進化過來的。同時是整體的,人的行為要實現從感知到傳導過程到記憶到使用到行為,動用了人的生物體各種功能系統,缺任何一個功能系統都是不行的,所以獨立的通用人工智能要從里面切出一塊那是不可能的。正是因為是通用人工智能,你能夠承擔人的智能任務,所以承擔著社會的角色和責任。
 
  把這些東西合在一起,不同的智力和他的形成和發展的特征放在一起,才是人的智能的整體的視圖。這樣的整體視圖我們怎么樣來實現它?我們要實現它首先得回答四個問題:第一個問題,定義清楚你要做的是什么?所以AlphaGo不是通用人工智能,因為它從來沒有說我要做通用人工智能。沃森也不是通用人工智能,他從來沒有說過他要做通用人工智能。所以首先要定義清楚你究竟要做什么;第二個問題,定義完以后能實現嗎?第三個問題,能使實現的話,給出一條路徑來;最后一個問題特別重要,真能做到了,你做不做?該不該做?這就是今天我們人工智能威脅論的主要需要回答的問題。
 
  為什么我的第三本書原計劃這個月要封稿的,但是到今天沒有完成。是我寫的過程中越來越忐忑。這本書到底該不該寫,該不該出?這是我今天最主要的糾結。我定義的是非生物智能體,在《智能原理》這本書里明確定義了,這個東西就是非生物智能體。有自我和意識,能夠擁有、調用、控制、維系其生存和發展的所有邏輯、物理資源。所以計算資源不是別人的,這個動力不屬于別人的,是自己管理和控制的,所以才能成為社會主體。能夠完成社會交給他的任務,履行社會職責,同時跟人一樣,從一開始處理的是含義而不處理符號。符號只是他處理不了的時候臨時放在那的,但是只要進到智能體內部一定是含義,不是符號。
 
  怎么做呢?這個路徑就來回答怎么做。這個“做”大體上要滿足一個獨立的社會的跟人一樣的智能體得有相應的功能和約束。所以首先一個原則,他和人一樣,有相應的功能。而這個功能是由一個一個功能體系來實現的,同時他要擔當社會角色,承擔社會責任。在這里面一個重要的事情是人的智能40多億年,不要以為我們可以把最早的原始生命體的基因去掉,去掉以后對不起,人就是殘缺的。所以從40多億年第一個生命體開始,他所有的故事都是我們今天智能的重要的構成部分。這幾百年構成了我們今天在人類社會行為的主要的知識體系,但是不要忘了,沒有前面的就沒有后面的。但是怎么辦呢?我們這個智能體不能有多少年,不可能的,必須要比較短的實現它,所以我們用空間換時間。我們用多少億的并發來實現時間的年代的迭代,所以這是一個最基本的原則。我們用大規模并行自我生長,一個一個獨立的很小的,既有獨立的智能功能的小的東西在一個總的架構下持續的生長,來用空間換時間。
 
  人的功能,通用的非生物智能體他有11個功能體系。從感知開始到描述、記憶,通過連接計算,和我們相應的行為生成交互,來完成人的全部的東西。我的第三本書《智能工程》大體上分成兩個部分,一個是11個功能系統,第二個部分是一個生命周期。兩個內容構成了第三本書的框架。
 
  它的功能體系,我就先不展開講了。人有生命周期,智能有生命周期,非智能生物體同樣有生命周明,它的起點是初始賦予,這個遺傳的過程依靠人給它賦予,所以初始是由人來賦予。賦予之后成長,成長的過程就像孩子從懷孕一直到成為獨立的法律主體之前,需要大人的監護。所以說是在人創造的環境當中成長。那么長大了,18歲了,就得履行職務,要承擔社會中的任務而不是科研的任務,是真正承擔社會中人承擔的各種各樣的事情,不是科研而是承擔社會責任。最后,是復制和終止,也就是說你可以傳承下去,這個跟人不一樣,傳承不等于原來的滅亡。可以并行的一個一個的生出來,所以這是它的生命周期。
 
  剛才講了功能系統,一個個功能系統都是由四個層級的,最低層級就是微處理器,上面是功能組織,再上面是功能子系統,最上面是功能系統。功能系統有11個,下面有子系統。所以構件最基礎的是微處理器。微處理器,我說的非生物智能體要達到一個人的能力的微處理器有多少?大概10的12-13次方,是如此大量。功能是萬億、十萬億微處理器。微到什么程度?微到一個字就是一個微處理器。而且這個微處理器是這個字的百科全書,比百科全書還要厲害。為什么?它是直接跨界到所有的應用場景中去。所以不是一句話一段文字一篇文章是一個微處理器,而是一個字,任何字母,世界上只要有文字的所有的字母,一個字母就是一個微處理器,只有這樣才經過描述、連接、記憶變成真正智能體理解的東西,而不是符號。只要進來絕不是符號,他就是他,只要進入智能體就是含義,絕不是符號,跟符號沒有任何關系。
 
  感知處理器十分復雜,感知處理器怎么做?存算一體,類似于FPGA,每一個微處理器有它的操作系統,而這個操作系統用FPGA格式來實現。每一個微處理器都有自己的操作系統、存算體系,都有一個獨立的功能。總而言之,就是所有的相關都進來了。功能組是一組微處理器構成的,變成一個功能組,上面就構成功能子系統,所以一個詞、一句都是一個功能組。智能體說了有11個功能系統,一個功能系統下面大概有幾萬到幾十萬個子系統,有百萬到千萬級的功能組,有億到十億量級的功能系統,所以微處理器將是百億甚至更多。
 
  其實構件還有一個東西就是客觀對象,客觀對象需要不同功能系統來處理的,所以我們還有一個邏輯的構件體系,就是所有的認知對象。比如說蘋果,其實蘋果已經是一個集成的智能單元,下面還有一組智能單元把各個功能系統里面相關的東西集成起來。
 
  那么怎么實現?其實很簡單,我始終說,這個東西的實現幾乎就是持續的1+1+1+1……,而所有的“1”今天已經存在,也就是說我們在座的人一個人都可以做很多很多的“1”。比如編一個 “狄”字,從微處理器到百科全書形成起來,它的音形意、變體、主要使用上下文都集中起來。只要智能體有各種接觸環境或者任務觸發它的時候就可以用它了。有音形意,有變體,有場景,我們就可以用它了,所以每個人都可以做很多的基本的構件。
 
  路徑就是0-1、1-n、n-N的過程,所謂0-1就是一個具體構件從起步到基本運轉起來;1-n,這個可以工作了;n-N就是這個構件完備了,可以遺傳可以復制。當然這里面1-n不僅僅是指一個微處理器成熟程度往前走,還指微處理器構件數量不斷增長,增長到10億到萬億這個量級就可以工作了。到N就是完備的了。比如說 “狄”,不同音形意,今天都存在了,當你用到“狄”這個字的時候,通過連接進到這里面都能完成,沒有任何的困難,這就是它的發展過程。
 
  我們來看蘋果,沿著它逐步的增長,從基本認知到拓展認知、延伸認知、歸納演繹、藝術、抽象、邏輯、科學、空間、發散思維,都在這樣的過程中來做。這個“做”只要在記憶中完成有效連接,任何任務的觸發和這個東西實現有效的連接,那么所有過程都可以往前走。當然,這個寫的很簡單,真正要變成記憶的話,是一個極其大量的東西。極其大量太復雜了,你做完蘋果再做梨、桃、棗,都可以解決。這個程序稍微變一變就變成梨、桃、棗,而且有很多描述都可以變過來,實際上當你做的多了以后,同類之間的工作量會快速下降。如果只要做一個的話,這一個就夠一個人用機器做上幾年。
 
  所有啟動的構件都是今天人類智能已經有的,而且做的人能夠實現這個轉換過程。當然大家會說到高層怎么處理?其實不復雜,完全通過連接和結構來實現。當然要有原則、要有邏輯,那是另外的事。同時成長環境的要求是必須有的,就像我們從嬰兒到能夠獨立行為的一個主體之前,需要家長和社會的呵護一樣,需要環境。這個環境必須得存在,否則這個智能體要么夭折要么就變成壞人。今天人類社會里也有壞人,有遺傳的也有環境的。不好的東西,遺傳的我們不要傳進去,所以不能設置惡意路徑,遺傳不能有。當然環境也不能讓他夭折,而技術上不存在算法、算力的任何可能,因為是疊加的。一個微處理器,如果我們沒有存算一體的芯片,不要緊,因為一個微處理器它的計算量不大,還是用并行來解決所謂算力的問題。技術復雜性主要在于總體架構、成長路徑的規則化及規則的成長。采用交互、容錯、漸進的原則,技術上沒有雷區。
 
  我從去年到今年一直在算,做成一個比我們在座所有人都更加聰明的東西需要多少錢?大概千億美元到萬億人民幣,需要6-8年時間。而如果我當項目負責人或者總設計師的話,大概6-8年可以完成,但是我肯定不當,所以團隊是最大的困難。
 
  謝謝大家!
 
  備注:想收看楊學山老師視頻或下載楊老師PPT,請登錄CIO時代APP。

CIO時代培訓產品手冊


西宁沐足都有什么服务 江苏11选5任选三遗漏 湖南时时彩诈骗80亿 多彩网 11选5任3稳赚投注技巧 许华升的视频怎样赚钱 3d试机号走势图 福彩3d稳定盈利方法 山西快乐10分选号技巧 双色球篮球号码行列分布图 三星组六技巧 河北快3跨度综合走势 重庆幸运农场走势图官网 2018炸金花棋牌游戏 乐彩网首页福彩3d 用微信登录的炸金花 湖北11选5平台论坛