有史以來(lái),計算機第一次不依靠人類(lèi)的任何幫助,僅僅通過(guò)人工智能獨立發(fā)現了一個(gè)新的科學(xué)理論。
來(lái)自塔夫斯大學(xué)的計算和生物領(lǐng)域的科學(xué)家們編碼了這樣一套程序,它能夠讓計算機在面對一個(gè)新的科學(xué)問(wèn)題的時(shí)候,獨立地發(fā)展出一套解釋這個(gè)問(wèn)題的理論。他們選擇的是一個(gè)在生物領(lǐng)域里困惑科學(xué)家們120年之久的現象:渦蟲(chóng)(Planaria)被切開(kāi)之后是有能力進(jìn)行再生,形成一個(gè)新的個(gè)體的。這個(gè)奇怪的現象很久之前就被發(fā)現了,但至于為什么會(huì )發(fā)生,目前還沒(méi)有明確的答案。
然而,當把這個(gè)問(wèn)題交給計算機的時(shí)候,它就能通過(guò)逆向工程(reverse engineer)來(lái)找出一個(gè)能夠解釋這個(gè)過(guò)程背后機制的理論。具體的細節以及人工智能的方法被發(fā)表在最近的PLOS Computational Biology上。
研究者們表示,他們真正想要發(fā)現的并非一個(gè)新的器官是如何再生的,而是機體如何指導這個(gè)新生的器官長(cháng)成需要的樣子和大小。這些神秘的信息就隱藏在基因之中。
"現在,從遺傳實(shí)驗中得到的大部分再生模型都是些充滿(mǎn)了箭頭的圖表,告訴你這個(gè)基因調控那個(gè)基因,這當然沒(méi)什么問(wèn)題,但是,它并不能告訴你器官最終會(huì )發(fā)育成什么樣子,你也不能從這些遺傳調控通路模型中去得知這個(gè)機體最終是會(huì )長(cháng)成一棵樹(shù)呢,還是一只章魚(yú)?;蛘呤亲罱K變成人類(lèi)。"研究者之一的Levin這樣表示。"那些模型只是能夠告訴你再生發(fā)生的時(shí)候哪些成分是必不可少的,但它無(wú)法展示給你這個(gè)再生的過(guò)程是如何一步步發(fā)生的。"
所以,研究者想要用算法建立一個(gè)新的再生模型,它能夠告訴我們,給予生物體怎樣的刺激就能夠導致一個(gè)特定的成分再生。為了解決這一難題,研究者們利用進(jìn)化計算的思想發(fā)展了一個(gè)算法,這個(gè)算法能夠實(shí)現"自我進(jìn)化",并且能夠精準預測研究人員在渦蟲(chóng)再生實(shí)驗中所獲得的研究數據。他們希望通過(guò)這個(gè)算法找到一個(gè)能夠解釋所有已發(fā)表實(shí)驗數據的調控網(wǎng)絡(luò )。
那么這個(gè)調控網(wǎng)絡(luò )具體是怎樣找到的呢?
也許你已經(jīng)想到了,一開(kāi)始的時(shí)候,"未進(jìn)化"的隨機產(chǎn)生的調控網(wǎng)絡(luò )一般是不會(huì )產(chǎn)生任何與真實(shí)實(shí)驗相同的結果的。新的候選調控網(wǎng)絡(luò )的產(chǎn)生是結合之前已經(jīng)存在的調控網(wǎng)絡(luò ),并在此基礎上做隨機的刪減增加。所有的候選網(wǎng)絡(luò )都會(huì )在模擬試驗中進(jìn)行檢測,算法會(huì )把那些通過(guò)這個(gè)候選調控網(wǎng)絡(luò )發(fā)育出來(lái)的結果和數據庫里真實(shí)的實(shí)驗數據作對比。在這個(gè)"進(jìn)化"過(guò)程中,就會(huì )逐漸產(chǎn)生新的能夠解釋更多實(shí)驗數據的候選調控網(wǎng)絡(luò )。
研究者們最終把這個(gè)算法應用到由渦蟲(chóng)再生的16個(gè)關(guān)鍵實(shí)驗數據所構成的數據庫中,希望找到一個(gè)能夠全面解釋渦蟲(chóng)再生的調控網(wǎng)絡(luò )。42小時(shí)之后,這個(gè)算法給出了一個(gè)能夠精準模擬出16個(gè)關(guān)鍵實(shí)驗全部實(shí)驗數據的調控網(wǎng)絡(luò )模型,這個(gè)新的調控網(wǎng)絡(luò )包含了其中已知的重要調控分子以及兩個(gè)還未發(fā)現的蛋白。
對于這樣一個(gè)振奮人心的實(shí)驗結果,研究人員們表示:"這個(gè)項目最大的意義在于,我們所獲得是并不是一個(gè)異常復雜、無(wú)法理解的調控網(wǎng)絡(luò ),相反,結果表明人工智能是可以幫助我們來(lái)發(fā)現一個(gè)簡(jiǎn)潔的、易于理解的模型。這意味著(zhù)人工智能可以滲透到現代研究的任何一個(gè)領(lǐng)域,不僅僅是對實(shí)驗中產(chǎn)生的大數據進(jìn)行數據挖掘,同時(shí)還可以幫助我們去理解這些復雜數據背后的簡(jiǎn)潔原理。"