下一個AI王炸，別只盯著OpenAI，DeepMind也在憋大招

發(fā)布時間：2023-04-10 文章來源：本站瀏覽次數(shù)：1984

過去幾個月，OpenAI風頭無兩，各大科技公司力爭上游地跟進大言語模型（LLM）這一技術道路。

比照之下，OpenAI的老對手DeepMind，顯得有些低調(diào)和緘默。微軟靠OpenAI打了一場勝仗，而谷歌推出的Bard翻了車，和谷歌同屬AlphaBeta的DeepMind卻沒有出來力挽狂瀾的意義。

同樣是半學術、半企業(yè)科研性質(zhì)的前瞻性AI Lab，DeepMind也瞄準了通用人工智能AGI，但完成途徑上，卻有著和OpenAI不同的選擇。

這段時間我們能看到科技圈在集體“追風口”，大量資源（留意力、算力、人才、政策等）都被投入到OpenAI引領的大言語模型熱潮中，有些高校以至呈現(xiàn)了“不做LLM就沒有算力用”的場面�！爸袊鴽]有本人的OpenAI”也被以為是創(chuàng)新滯后的理想證明。

有人說OpenAI的AI屬于“精英教育道路”，一路砸錢供它讀到博士，一畢業(yè)就是王炸，冷艷全場，這點的確沒錯，也是十分值得很多國內(nèi)AI Lab學習的。

追逐OpenAI的賽道曾經(jīng)非常擁堵。別忘了，DeepMind默默燒錢、長期錨定的很多研討方向，也十分具有前沿性和想象力，2016年的AlphaGo、2020年的AlphaFold都曾一鳴驚人。下一個“AI王炸”，可能就是DeepMind做出來的。

大家曉得有種新聞叫“震驚體”，每一次呈現(xiàn)“AI王炸”級產(chǎn)品，就會有大量“震驚體”呈現(xiàn)，比方“阿爾法狗要取代人類”“AlphaFold搶了生物學家的工作”“有了ChatGPT人類還有價值嗎？”

感到“震驚”，有時真的只是由于曉得的太少、太晚，在這些“AI王炸”技術尚在生長階段，無視了它們，等才能開展到適用水平，又開端恐慌、焦慮。

屆時，我們會不會又會墮入新一輪的追逐跟風，接著埋怨“中國沒有本人的DeepMind”呢？

所以，我們無妨來預測一下，DeepMind正在憋的大招里，哪些可能成為下一個王炸，讀者們能夠有個心理準備，提早對“震驚體”脫敏。

AI要取代科學家，夠不夠震驚？

ChatGPT走紅之后，很多白領人士都擔憂本人的崗位要被取代了。而科學家可是智力程度站在金字塔頂端的人類，職業(yè)生活肯定穩(wěn)穩(wěn)的吧？

AI+科學，正是DeepMind長期錨定的賽道，曾經(jīng)產(chǎn)出了很多打破性的研討成果，掩蓋了數(shù)學家、物理學家、生物學家的專業(yè)范疇。

曾經(jīng)問世的AlphaFold和AlphaFold 2就在生物學界掀起了海嘯級的影響，徹底改動了蛋白質(zhì)構造預測的傳統(tǒng)辦法，也引發(fā)了各大高校和科研機構的復現(xiàn)、優(yōu)化、應用�；谶@一新技術，DeepMind一夜之間改動了生物制藥行業(yè)，也因而成為“數(shù)字生物學”這一新興范疇的先驅(qū)。

目前，AI+生物學的潛力還沒有完整釋放出來，AI技術在生物制藥和生命科學中的應用，還停留在少數(shù)環(huán)節(jié)中探究、案例級嘗試的階段。DeepMind也正在與行業(yè)展開協(xié)作，比方與Isomorphic Labs 協(xié)作，以“AI-FIRST”準繩重構藥物發(fā)現(xiàn)過程，在著名的生物醫(yī)學研討中心弗朗西斯·克里克研討所（Francis Crick Institute），建了一個濕實驗室，增強AI技術與生物實驗的分離，同時還在不時擴展AI for science團隊，加快根底生物學的研討。

或許，下一個抗癌新藥、生物計算范疇的大打破，就會在DeepMind降生。

（AlphaFold提醒了蛋白質(zhì)宇宙的構造）

你可能會說，生物學是一門實驗科學，有成熟的程式，被AI技術改動很合理。數(shù)學、物理這樣的根底科學，打破簡直來自天才式的直覺和靈感，有的數(shù)學家以至是在夢中獲得打破。比方阿基米德就是在洗澡時靈光一現(xiàn)，發(fā)現(xiàn)了浮力定律；拉馬努金在夢中發(fā)現(xiàn)了3900個公式……AI估量就不好使了吧？

數(shù)學、物理，這些觸及籠統(tǒng)世界和人類深層直覺的范疇，DeepMind也曾經(jīng)獲得了打破。

協(xié)助數(shù)學家發(fā)現(xiàn)他們從未發(fā)現(xiàn)的發(fā)現(xiàn)——DeepMind發(fā)表在《自然》雜志上的一篇論文顯現(xiàn)，研討人員與頂級數(shù)學家協(xié)作，為一個幾十年來都沒有結局的數(shù)學猜測，經(jīng)過機器學習（ML）找到了打破口。

運用AI來處置海量或無法直接推理的數(shù)據(jù)，能夠大大加強數(shù)學家的洞察力，從而更快地找到證明猜測和新公式的辦法，曾經(jīng)被DeepMind證明是可行的。

牛津大學數(shù)學系教授Marcus Du Sautoy形容AI技術在純數(shù)學中的應用，“就像伽利略拿起望遠鏡，可以深化注視數(shù)據(jù)宇宙，看到以前從未發(fā)現(xiàn)過的東西”。

將來隨著探究的增加，很多未被證明的數(shù)學猜測，都有可能因AI的參加而打破。希望屆時大家不會又以為AI進化出了什么超才能，被“AI取代數(shù)學家”之類的標題給騙了。

AI參與核聚變的研討進程——核物理無論從學術還是社會政治經(jīng)濟的角度，都是十分重要的。大家可能都聽過中國核物理學家造原子彈的艱辛故事，其中很多工作和犧牲能不能由AI來代勞呢？DeepMind還真搞成了。

它們與瑞士等離子體中心，協(xié)作開發(fā)了一個AI系統(tǒng)，經(jīng)過強化學習，控制系統(tǒng)能夠很好地諧和TCV（由許多磁線圈組成），確保等離子體永遠不會接觸容器壁，這樣就能夠減少核聚變的熱量損失。同時，還能將等離子體準確地雕琢成不同的外形，便當科學家研討等離子體在不同條件下的反響，從而進步對核聚變反響堆的了解。

總之，在過去的幾年里，DeepMind在數(shù)學、物理、化學、生物學、量子、氣候、資料等多個科學范疇，發(fā)明性地探究了大量AI for science的可能，帶來了全新的科學研討辦法，必然會催生全新的科學發(fā)現(xiàn)和技術打破，下一個“AI王炸”很可能就在其中。

理想版《西部世界》夠不夠炸裂？

DeepMind的目的也是完成通用人工智能。詳細怎樣做呢？OpenAI專心搞言語，DeepMind就專注“訓狗”——搞強化學習。

弱人工智能，只能在有限的環(huán)境中處理特定問題，沒有開展出人類身上那種通識智能。那種“通用”智能的機器，大約就相似于《西部世界》或者《底特律》中的機器人，可以在復雜的環(huán)境里執(zhí)行任務。

完成AGI，OpenAI是用大量數(shù)據(jù)和充沛鍛煉來促成大言語模型的“智能涌現(xiàn)”，而DeepMind則選擇了“正向教育”——希望經(jīng)過強化學習，給AI系統(tǒng)以“獎勵大化”的刺激，差遣智能體自主去學習復雜的才能。由于只要表現(xiàn)出這些才能，智能體才干取得獎勵（比方生存下去）。

聽起來，是不是跟工作犬執(zhí)行主人的口令，主人依據(jù)結果來停止獎勵或懲罰是一個路子？

在一篇論文中，DeepMind的研討人員寫道：“獎勵足以推進智能體表現(xiàn)出通用智能的跡象和行為，包括學習、感知、社會智能、言語、概括和模擬。”

上一只震驚世界的狗是擊敗人類棋手的“阿爾法狗（AlphaGo）”，而下一只可能就是被DeepMind用強化學習鍛煉出來的AI了。

（ANYmal機器人的運動技藝是經(jīng)過模擬狗MoCap來學習的）

比方這只機器狗，就經(jīng)過強化學習不時試錯，從而具備了兩個重要的才能：

一是運用歷史經(jīng)歷，普通來說電機控制的AI智能體，一開端不曉得對每個關節(jié)施加什么力，需求大量數(shù)據(jù)才干邁出步子，不然就會隨機抽搐并疾速摔倒，而借助RL能夠應用以前學到的運動技藝，從而緩解“起步”時的為難。

二是減少特殊行為，此前智能機器人普通會用一種很不自然、不夠人性化的方式來避障，固然看起來很有趣，但不夠適用。DeepMind采用強化學習鍛煉，傾向于讓智能體學習更多的自然行為，能夠平安高效地控制真實世界的機器人/機器狗，將機械控制與認知聰慧相分離。

相似的強化學習實驗還有很多，比方讓智能體在網(wǎng)絡游戲中展開隨機互動，讓智能體在模仿的三維世界里搭積木、清掃房間……根本邏輯都是基于人類反應的獎勵模型。

ChatGPT只能處理言語問題，《西部世界》里的人機交融新物種，更靈敏的通用家政機器人，可能還真得靠DeepMind的強化學習道路來完成。

像人腦一樣考慮的AI，夠不夠有趣？

DeepMind固然沒有跟風推出類ChatGPT的大言語模型，但并不代表它對這個范疇毫無建樹，只不過二者關注的技術方向不太一樣而已。

隨著運用者的增加，大家可能都發(fā)現(xiàn)了類ChatGPT模型的一些限制，比方十分注重數(shù)據(jù)和語料。

深度學習靠范圍數(shù)據(jù)、龐大算力、充沛鍛煉而“鼎力出奇觀”的暴力美學，在大模型時期發(fā)揮到了極致。

這帶來了一系列問題，比方中文語料缺乏，訓出來的大模型效果不好，有的中文LLM會用英文語料停止鍛煉，再將答案翻譯回中文，這種做法當然是契合業(yè)界常規(guī)的，但問題在于很多價值觀、常識性的東西，是沒有方法對齊和翻譯的。

而且“暴力計算出奇觀”的大煉模型，打造的言語模型是不可解釋的黑盒，金融、政務、工業(yè)等行業(yè)是不敢用的，無法支撐牢靠的決策。

不曉得OpenAI和國內(nèi)廠商打算怎樣處理“暴力計算”的弊病，反正DeepMind倒是不斷在揣摩不同的道路——不搞暴力美學，大搞神經(jīng)科學。

DeepMind以為大腦才是機器智能模擬的對象，希望經(jīng)過對腦科學、神經(jīng)運動學、元學習等“人類本位”的研討，來提升深度學習模型的魯棒性、可解釋性、牢靠性等，讓AI到達人類程度的了解才能。

比方重新認識大腦的工作機制，自創(chuàng)多巴胺經(jīng)過調(diào)理神經(jīng)元之間突觸銜接的強度，提出了一種基于獎勵的強化學習理論；

在3D游戲世界中創(chuàng)立了模仿心理學實驗室Psychlab，可以施行經(jīng)典的心理實驗，顯著改良了智能體UNREAL的性能；

發(fā)如今人工神經(jīng)網(wǎng)絡傾向于避開準確設計的代碼，傾向于對本錢函數(shù)停止暴力優(yōu)化（不追求獎勵大化，而是追求本錢小化，不做錯就沒有損失），而人腦的機制卻常常會專注在任務完成和獎勵上，從這個角度去優(yōu)化深度神經(jīng)網(wǎng)絡的構造。

2023年發(fā)表的一篇新論文中，DeepMind則針對大腦中的回放（replay）機制，提出這是一種組合計算的方式，能夠衍生出新的學問，在神經(jīng)網(wǎng)絡中整合回放機制，有望讓AI用極少的數(shù)據(jù)學到新東西，進步認知智能，更接近“智能涌現(xiàn)”。

大腦的聰慧讓人類爬上了萬物之靈的寶座，AI不靠人工而靠智能，為什么不可能呢？

當初OpenAI要走NLP這條“冷門”的路，很多人也覺得不可能，直到產(chǎn)品雖不成熟、但才能非常冷艷的ChatGPT呈現(xiàn)，人們才開端紛繁夸獎OpenAI的長期主義。這些年DeepMind默默搞的研討，可能就是下一個“王炸”。

我們都希望中國AI也能降生影響世界的元創(chuàng)新，其實AI范疇并沒有那么多獨門秘技，很多靈感或技術道路都是公開的，但我們?yōu)槭裁纯偸锹犨^就算、見過就忘呢？

除了靈光一現(xiàn)的idea， OpenAI和DeepMind不時投入的耐煩，強大的工程才能，前沿研討與商業(yè)化的均衡，也是值得學習和自創(chuàng)的。

不能總是百感交集，總是不長忘性，直到下一個《震驚！XXX的XXX又推翻世界了》……

上一條：ChatGPT放大AI引...

下一條：簡單易上手的AI繪畫！直...

下一個AI王炸，別只盯著OpenAI，DeepMind也在憋大招

下一個AI王炸，別只盯著OpenAI，DeepMind也在憋大招