近日,MIT材料科學與工程係李巨、Tonio Buonassisi、任之初等人在Nature Reviews Materials的Comment欄目發表題為“Autonomous experiments using active learning and AI”的文章,介紹了由主動學習和AI驅動的智能自主實驗。
主動學習和自動化並不能讓人類輕鬆地擺脫實驗室的工作。在它們對新材料研究產生實質性的影響之前,我們必須非常仔細地部署人工智能係統,確保它們能夠穩定地運行,並且能夠應對各種偏差,包括隨機噪聲(stochastic errors)和因人類對所研究的問題認知不足而導致的認知性偏差(epistemic errors)。如今,隨著自動化和AI逐漸普及,我們需要認真考慮自主實驗室的可重複性、可重配置性和實驗互通性這些關鍵因素。
探索新材料是一個勞動密集型過程。愛迪生為了發明白熾燈泡,測試了數千種燈絲。現如今,便宜的自動化設備讓結合機器人和主動學習算法的新研究方法成為可能。雖然在預算和空間有限的情況下,構建完全自動化的實驗平台是非常具有挑戰性的,但是在半自動化的工作流上也可以取得不錯的進展。例如,在儀器之間完全可以保留傳統的手動轉移樣品,並不一定要使用機械臂或者是傳送帶之類的自動化。隻要實驗結果高度可重複,即使使用一些基本的機器學習方法,比如高斯過程回歸和貝葉斯優化,就已經能很好地解決許多材料優化問題。
就像把孩子養大需要幾十年時間,並且在這過程中需要教他們各種各樣的東西一樣,人們不應該期望在知識基礎比較有限的情況下,由主動學習(active learning)驅動的實驗一開始就非常有效。這個學習過程在開始時往往是非常脆弱的。教一個小孩子走路需要很多手把手的引導,同樣地,驅動實驗的人工智能在一開始也需要很多指導,即使其調用的自動化平台看似十分“穩定高效”。
01 認知性偏差的挑戰
能夠獲得長期可複現的數據集是自動化平台有能力開展主動學習的衡量標準。當一個實驗重複兩次產生不同的結果時,差異主要來自兩個方麵:偶然性偏差和認知性偏差。偶然性偏差源於隨機性,可以通過提升自動化占比和在模型中引入高斯過程噪聲核來有效緩解,因此相對容易處理。相比之下,認知性偏差則可能會影響自主化實驗的成功,尤其是在主動學習算法還未經過優化調整的情況下。認知性誤差,從本質上講,就是由於我們科研工作者的“知識偏見”——我們認為一些變量在多次試驗中是恒定的,但實際上它們在“悄悄”地變化。
以我們實驗室的自動化滴塗碳基底樣品過程為例,有段時間我們發現即便是重複同樣的實驗,樣品的性能差異也很大。直到有一天,我們注意到碳基底可能是各向異性的,也就是說我們切割它的方式(從市場上買來的片狀切成條狀)是一個重要的變量,直接決定了滴塗後樣品擴散的方向和最終麵積。而在此之前,我們一直很自信地默認這個基底是各向同性的。諸如此類的知識偏見,很可能將直接導致整個機器學習項目失敗。
為什麼可複現性對主動學習特別關鍵?手動實驗不也麵臨這個問題嗎?答案是肯定的,但人類的經驗和靈活性大大緩解了這個問題。想象一個學生發現了一種合成方法,重複了10次,其中2次得到了非常令人興奮的結果。學生會怎麼做?誤差區間太大,無法發表,所以學生和導師會討論、調整設置,最終找出統計異常背後的原因(例如,中間反應產品的外來水分含量)。
統計上的異常源於我們沒能找齊決定了實驗結果的變量全集。如果我們選擇忽略而不是去深入調查和試圖理解我們漏了哪個隱藏變量,其結果就是,我們發現自己的實驗難以複現。《自然》雜誌的一項調查顯示,文獻中不可複現性的主要原因是選擇性報告,其本質也是類似的——文獻隻披露了實驗變量全集的一個子集(也許作者自身也未意識到)。如果我們還沒搞清楚誤差來源就輕率地啟動一個主動學習項目,這可能會浪費大量時間和金錢。算法會錯誤地將特殊的噪聲視為信號,從而給出糟糕的建議,正所謂“garbage in, garbage out”。
另一方麵,如果我們仔細地去排除認知性偏差,找出隱藏變量,可能會有意想不到的科學發現,就像青黴素是由於意外真菌汙染而未能培養細菌培養物所發現的。人類非常擅長扭轉“實驗失敗”,因為我們有著出色的因果推理能力(用福爾摩斯的話說,“一旦排除了所有可能性,無論剩下的是多麼看似不現實的推論,必定就是事實”)。可惜的是,樸素的主動學習方法並做不到這些,因為它們被設定了過於簡化的世界觀,而且沒有太多先驗的物理知識。
與傳統機器學習技術不同,大型語言模型如ChatGPT能生成科學上合理的猜想。未來,我們有望利用更先進和全麵的自主實驗室來驗證這些由大模型生成的假說。比如,我們可以在受控的氣氛反應室內自動重複合成程序,以探究實驗結果對不同氣體分壓的依賴性。隨著自動實驗引入計算機視覺(在某些方麵已超過人類視覺),以及借助於龐大的先驗知識庫,AI係統將能更精確地跟蹤實驗室條件(例如濕度、背景輻射、前體材料的紋理和不均勻性)。因此,隨著AI係統逐漸整合多模態傳感器,弄清認知誤差的可能原因並針對性地調整工作流程隻是時間問題。大型語言模型結合具有通用感覺運動功能的強化學習,以及下文所述的“新控製論”,很可能是實驗室自動化革命的下一個步驟。
02 AI驅動的自主實驗室網絡
隨著AI係統變得更加複雜和強大,預算和空間的限製,模塊化的雲實驗室設施將變得有必要。這類新型實驗室不僅需要能重新編譯和鏈接各種實驗設備,還需要確保多個自動實驗室之間的互通性。一個包括實驗和理論兩個方麵的龐大的AI網絡將被建立,以實現實驗室級的勞動分工、規模經濟和互相製衡。例如,當某個AI實驗室製備出了具有突破性性能的樣品後,AI網絡會負責將(i)該製備方案發送至負責理論研究的AI實驗室進行分析,(ii)在該實驗室本地複製多份物理樣品並傳送至多個專門負責測試的AI實驗室,(iii)製備方案本身分發至負責製備同類型材料的AI實驗室以進行對抗性的複現測試。
今天的材料合成、表征和性能測試的設備主要是為人類用戶設計的。未來,自主實驗室每台設備都需要具有兩個接口,一個主接口服務於物聯網上的AI係統,另一個用於人類操作。每個設備模塊將更像是軟件庫中的子程序,其物理樣品輸入/輸出規範將被明確且嚴格地定義。設備鏈將具備快速和自動的重配置能力,以滿足不同科研項目的需求。值得注意的是,重新配置並不意味著需要將設備物理移動以組成一條流水線,因為輪式機器人和小型無人機將負責模塊之間的樣品傳送。
雖然自主材料研究實驗室的概念早在1950年代就已經出現,但至今成功的案例仍然較少。目前在學術界,實驗室大多還是以人為核心,且每個實驗室的建設預算僅限於幾百萬美元或更少。這通常意味著單個實驗室隻有自家“一招鮮”或“幾招鮮”的手段,這使得它們在識別認知誤差或迅速適應工作流變化方麵表現不佳。當懷疑有些不尋常的情況發生時,人類研究員會向校園內從事不同領域的同事尋求幫助,請他們進行補充測量。這種靈活性在科研探索過程中是非常重要的,反觀我們今天的以機器和AI為核心的自主實驗室案例,由於規模太小,還無法做到類似的靈活性。
為了解決這個問題,不同的自主實驗室需要實現更好的協同工作。例如,讓AI有能力將一個物理樣品及其對應的元數據從一個實驗室傳送到另一個實驗室。這樣的任務需要我們建立標準化的數據和樣品傳輸協議,比如規定用於傳輸液體、粉末、凝膠、顆粒和單晶材料的膠囊,它們需要與易於稱重、尺寸測量以及光學和化學表征設備相兼容,還需要能有效防止外界汙染。此外,我們可能還需要重新考量設計建築和基礎設施,例如無人或者是機器人和人類研究人員共同工作的全新的建築架構。
AI時代已經來臨。為了在實驗研究和材料發現中充分釋放AI的潛力,為矽基智慧提供“手”(材料合成加工/樣品轉移/設備模塊重組)和“眼睛”(材料表征/多模態感測)至關重要。建立一個穩健的AI對於現實世界的感知反饋係統絕非易事。但是,隨著AI實驗室的正確配置和相互鏈接(核心是標準化接口和模塊化設備),以及全球廣泛共享的專業知識,強大的AI自主實驗室可能會徹底改變材料研究。
未來雲端實驗室可以被建設在太陽能/風能充足的荒漠中,科研人員可以從全世界任意一個地方控製雲端實驗室。園區內的兩大主體——數據流和物質流,將分別由互聯的AI網絡和機器人網絡負責運載。(本圖由MidJourney + Adobe Firefly生成)
雲端實驗室內部由一個個的模塊組成。每一個模塊就像一個代碼中的函數,有著清楚的輸入輸出規範,例如輸入的材料樣品必須符合某個標準化的尺寸/形態。不同模塊之間由輪式機器人或小型無人機進行樣品傳送。
機器人底盤Disinfection Robot消毒機器人講解機器人迎賓機器人移動機器人底盤商用機器人智能垃圾站智能服務機器人大屏機器人霧化消毒機器人紫外線消毒機器人消毒機器人價格展廳機器人服務機器人底盤核酸采樣機器人機器人代工廠智能配送機器人噴霧消毒機器人圖書館機器人導引機器人移動消毒機器人導診機器人迎賓接待機器人前台機器人消殺機器人導覽機器人 |