如果這是未來的生物學(xué)實驗室,那么它看起來與今天的實驗室似乎并沒有什么不同。穿著白大褂的科學(xué)家拿著盛有冷凍玻璃管的箱子走過,架子上的化學(xué)物質(zhì)——純酒精瓶、糖罐、蛋白質(zhì)和鹽是培養(yǎng)和調(diào)節(jié)微生物的標(biāo)準(zhǔn)物件。如果不是耳朵聽到的機械聲音,你可能根本不會注意到這里的機器人:它們在風(fēng)扇的低嘯中像蟋蟀一樣彼此哼唱著。
這些機器人為生物技術(shù)公司Zymergen工作,這家公司在2014年搬遷到美加州舊金山東海岸一家原電子工廠所在地。這些機器人整日都在進行微生物實驗,尋找增加有用化學(xué)物質(zhì)產(chǎn)量的方式。這是一個叫作“回聲”的機器人:它位于一堆雜亂的設(shè)備中間,一只機械臂抓住一個塑料模塊,模塊上有數(shù)百個細(xì)微孔徑,其中盛著液體。一束激光掃描了模塊旁的一個條形碼,然后“回聲”將其運到一個托盤上。下一步發(fā)生的過程及其細(xì)微,用肉眼難以觀察到。
“這并非是人們?nèi)绾蝿邮钟梦乒芪埔后w的復(fù)制品。”該公司共同創(chuàng)始人之一、分子生物學(xué)家兼操作及工程副總裁JedDean說,“這是以完全不同的方式在執(zhí)行這件事。”機器人無須用吸移管吸收并將數(shù)毫升的液體注入到每個孔中(在細(xì)胞層面液體量的漲落),且并不會碰觸它。相反,一束聲波脈沖會以每秒鐘500次的頻率讓液體自己泛起漣漪,并形成比人類可轉(zhuǎn)移的液體量小1000倍的液滴。
實際上,這些并沒有真正未來主義的部分。大型生物實驗室使用機器人和條形碼已有多年。即便是被稱作“聲微滴噴射”的液體去除技術(shù)也已經(jīng)存在了數(shù)十年。當(dāng)Dean被問到這臺機器人通過什么在做實驗時,他才透露了一點真相。實際上,這是一個計算機程序輸出。
“我想要說清楚的是,這個過程中有一位人類科學(xué)家在了解結(jié)果和現(xiàn)實,并核查它們。”Zymergen執(zhí)行總裁JoshuaHoffman解釋說。他表示,對于解釋數(shù)據(jù)、生成推論以及計劃實驗來說,其終極目標(biāo)是“擺脫人類的主觀直覺思維”。
Zymergen是若干家擁有相同目標(biāo)的公司之一:利用人工智能(AI)增加或替代科學(xué)過程中的人類角色。人們用“AI驅(qū)動的生物技術(shù)”來描述這一過程,但Zymergen共同創(chuàng)始人對這一說法表示擔(dān)憂。“‘AI’聽起來像是機器人在下象棋。”該公司首席技術(shù)官AaronKimball說,“我覺得‘ML’讓人更加舒服。”Hoffman說,ML指的是機器學(xué)習(xí),即可以解釋最近幾乎所有AI進展的計算科學(xué)的分支。“這正是我們正在做的。”
自動化發(fā)現(xiàn)
科學(xué)是一個序列。日復(fù)一日的實驗室工作與工廠工作是如此不同。論文來了,啟發(fā)新的實驗,然后產(chǎn)生新的發(fā)現(xiàn),結(jié)果又產(chǎn)生新的論文。如此循環(huán)。各種各樣的公司和研究機構(gòu)正在拓展基于機器人和AI的工具,以增強甚至替代這個過程的每個步驟中人類的角色。
Zymergen實際上做的是調(diào)節(jié)可用于生物質(zhì)燃料、塑料或藥物的產(chǎn)業(yè)微生物。為了提高產(chǎn)量,一些公司將它們的菌株送到Zymergen。那里的機器人于是便探索和修復(fù)每個微生物的基因組,從而設(shè)計出一個使其合成產(chǎn)物更加高效的菌株版本。
Hoffman表示,問題在于被送到Zymergen的微生物已經(jīng)“高度優(yōu)化”。經(jīng)過數(shù)年的研究育種之后,這些細(xì)胞非常擅長發(fā)揮自己的功能。因此,“擠”出更多的效率需要深入探索其基因組、開展實驗以及跟蹤相關(guān)數(shù)據(jù),進行科學(xué)研究。
Zymergen正在設(shè)法加速這一科學(xué)過程。在傳統(tǒng)生物學(xué)中,Hoffman表示,“需要一個人站在工作臺前測試有限數(shù)量的假設(shè)??赡苊吭驴蓽y試10個假設(shè)。”而機器人可以用更快的速度完成這一過程,Zymergen的機器人每周可以進行多達1000個實驗。但機器人只能遵循指令:給它們正確的指令是真正的瓶頸所在。
當(dāng)被問這個算式如何設(shè)計實驗時,Kimball提到了一個簡單的前提。“比如說你得到了約5000個基因的原始微生物,而你改變每個基因的方式有10種,這就意味著你要做5萬個實驗。”他說,實驗“活動”從制作1000個菌株開始,每個菌株都有一個特定的突變。“每個菌株都生活在一個液滴中。你給它喂糖,然后讓它烹飪一會,接下來是測量獲得了多少產(chǎn)物。”可能有25個菌株會產(chǎn)生略多一些的靶標(biāo)化學(xué)物質(zhì)。這些菌株將會成為下一輪實驗的良種,而其余的則會進入冷凍倉。
機器人定位
這一發(fā)現(xiàn)之路絕非坦途。Kimball說,找到適當(dāng)?shù)耐蛔兘Y(jié)合體需要漫長而艱難的基因“地形”探索之旅。如果只是盲目地朝著效率巔峰走,可能永遠(yuǎn)不會到達主峰頂點。這是因為如果只是把所有產(chǎn)生小提升的突變結(jié)合到一個微生物中,它們加起來可能并不能形成一次大收獲。他表示,相反,微生物會“生病”,它們會比原來的菌株性能差得更遠(yuǎn)。因此,選擇正確的道路,包括繞道進入更有潛力的谷地,也需要一張地圖從而一次性地展示所有突變效應(yīng),這張圖不是3個維度,而是數(shù)千個。因此就需要機器學(xué)習(xí)確定方位。
這是關(guān)鍵的差異:當(dāng)機器人最終發(fā)現(xiàn)能夠提高化學(xué)物質(zhì)產(chǎn)量的基因變化時,它們并不知道其效應(yīng)背后的生物化學(xué)線索。
那么,如果機器人實驗并不能加深人們對生物學(xué)工作的了解,它是真的科學(xué)嗎?對于Kimball來說,這樣的哲學(xué)界點可能并不重要。“我們是因為它的工作而得到了收益,并不是因為了解其中的原因而得到了收益。”
到目前為止,Hoffman說,Zymergen的機器人實驗室已經(jīng)將制作化學(xué)物質(zhì)的微生物的效率提高了10%以上。這樣的增加聽起來可能不多,但在每年依賴微生物發(fā)酵達到1600億美元的化學(xué)產(chǎn)業(yè)內(nèi),一小部分的提升也可以轉(zhuǎn)化為更多的資金,甚至比美國國家科學(xué)基金會每年70億美元的預(yù)算更多。
而機器人發(fā)現(xiàn)的先進遺傳變異代表著真正的發(fā)現(xiàn),這些可能是人類科學(xué)家并未發(fā)現(xiàn)的變異。大多數(shù)提高產(chǎn)量的基因并未直接與合成想要的化學(xué)物質(zhì)相關(guān),例如,其中一半并沒有為人所知的功能。“我已經(jīng)在若干不同微生物中發(fā)現(xiàn)了這種模式。”Dean說。不用機器學(xué)習(xí)找到正確的遺傳變異就像嘗試打開一個刻度盤上標(biāo)著數(shù)千個數(shù)字的保險箱。“人類的直覺很容易被這種復(fù)雜性壓倒。”他說。
計算機作者?
如果機器真的已經(jīng)準(zhǔn)備好替代人類執(zhí)行一些科學(xué)任務(wù),很多科學(xué)家將會擁抱它們。不像工廠工人或是出租車司機,大多數(shù)實驗科學(xué)家會很歡迎讓他們的部分工作自動化。在分子和細(xì)胞生物學(xué)領(lǐng)域尤其如此,因為其中的手工勞動如噴射液體、電鍍細(xì)胞、計數(shù)菌落等都非常繁雜且成本高昂。一名研究生最細(xì)微的錯誤或不精確性都會浪費數(shù)周甚至數(shù)月的工作。
然而,也有一些生物學(xué)家提出了支持AI解釋數(shù)據(jù)和設(shè)計實驗的一些不足之處。“我們發(fā)現(xiàn)目前的機器學(xué)習(xí)方法并不能勝任這一任務(wù)。”加州斯坦福大學(xué)計算生化學(xué)家RhijuDas說,他研究的是分子如何折疊從而設(shè)計新的藥物。“與獲得同樣數(shù)據(jù)的人類相比,它們在RNA設(shè)計問題上嚴(yán)重落后于人類。”盡管他并不知道這是為什么,但含有“設(shè)計”類的任務(wù)似乎需要人類的直覺??赡躗ymergen正巧碰到了非常適應(yīng)計算機控制的實驗的生物學(xué)部分。
即便AI控制的研究能夠起作用,人類是否會理解計算機發(fā)現(xiàn)了什么?其結(jié)果背后的計算仍是一個“黑匣子”。“一個令人困惑的可能性是我們正在接近‘可理解的’科學(xué)時代。”賓夕法尼亞州匹茲堡卡耐基·梅隆大學(xué)計算生物學(xué)家、與分子生物學(xué)家一起工作的AdrienTreuille說。研究人員可能不僅會依賴計算機做科學(xué),還包括解釋科學(xué):一些生物學(xué)理論證據(jù)如此復(fù)雜,接受它將需要對計算機抱有信心。
在這種情況下,科學(xué)家是否應(yīng)該將其計算機作為論文的共同作者?“我不會這么做。”波士頓將AI應(yīng)用于科學(xué)發(fā)現(xiàn)的一家公司Nutonian的首席執(zhí)行官MichaelSchmidt說。但他隨后表示:“當(dāng)計算機能夠閱讀并理解論文的意思之后,它們自己就可以成為作者。”