×

人工智能 AI Web3 科技

標題:震驚!機器人「ChatGPT 時刻」真相:不是技術突破,而是…

author author 发表于2025-03-22 17:25:08 浏览28 评论0

抢沙发发表评论

引言:去中心化物理人工智能的挑戰與機遇

2月27日,Messari 的一場播客聚焦“構建去中心化物理人工智能”, FrodoBot Lab 聯合創始人 Michael Cho 受邀分享了他對去中心化物理基礎設施網絡(DePIN)在機器人技術領域的見解。DePIN 機器人技術雖然尚處萌芽階段,但其潛力足以顛覆 AI 機器人在現實世界的運作模式。

與傳統 AI 依賴海量網絡數據不同,DePIN 機器人 AI 面臨的挑戰更加複雜,包括數據收集、硬件限制、評估瓶頸以及經濟模式的可持續性等等。本文將深入剖析此次討論的要點,探討 DePIN 機器人技術所遇到的問題,分析阻礙去中心化機器人發展的主要障礙,並闡述 DePIN 相較於中心化方法的優勢。最後,我們還將展望 DePIN 機器人技術的未來,判斷我們是否即將迎來 DePIN 機器人技術的“ChatGPT 時刻”。

DePIN 智能機器人的瓶頸分析

Michael Cho 在創立 FrodoBot 之初,最大的困擾便是機器人技術的高昂成本。市面上商用機器人價格居高不下,阻礙了 AI 在現實世界中的應用普及。他最初的解決方案是打造一款低成本的自主機器人,將成本控制在 500 美元,希望以價格優勢脫穎而出。

然而,隨著研發的深入,Michael 逐漸意識到,成本僅僅是表象,DePIN 在機器人技術中所面臨的挑戰遠比“貴不貴”要複雜得多。隨著 FrodoBot Lab 的不斷發展,DePIN 機器人技術的諸多瓶頸也逐漸顯現。要實現大規模部署,以下這些瓶頸必須被一一克服。

瓶頸一:數據收集的挑戰

與依賴海量互聯網數據的“線上”AI 大模型不同,具身化 AI (embodied AI) 需要與現實世界互動才能發展智能。然而,目前我們缺乏這種大規模的數據基礎,並且對於如何收集這些數據也缺乏共識。具身化 AI 的數據收集大致可以歸為以下三類:

  • 人類操作數據: 這是指人類手動控制機器人時產生的數據。這類數據質量很高,能夠捕捉到視頻流和動作標籤——也就是人類看到什麼,以及如何做出相應的反應。這是訓練 AI 模仿人類行為最有效的方式,但缺點是成本高昂,勞動強度大。
  • 合成數據(模擬數據): 這類數據對於訓練機器人在複雜地形中移動非常有用,例如訓練機器人在崎嶇的地面上行走。對於某些專用領域,合成數據非常有效。但對於一些變化多端的任務,例如烹飪,模擬環境就顯得力不從心。我們可以想像一下訓練機器人煎蛋的情形:鍋的類型、油溫、房間條件的微小變化都會影響結果,而虛擬環境很難覆蓋所有場景。
  • 視頻學習: 這種方法是指讓 AI 模型通過觀察現實世界的視頻來學習。雖然這種方法具有潛力,但它缺少智能所需的真正物理的直接互動反饋。

瓶頸二:自主性水平的限制

Michael 分享了他第一次在現實世界中測試 FrodoBot 時的經歷,當時主要讓機器人執行最後一英里的配送任務。從數據上看,結果其實還算不錯——機器人成功完成了 90% 的配送任務。但現實生活裏 10% 的失敗率是不可接受的。一個每十次配送就失敗一次的機器人,根本無法商業化。就像自動駕駛技術一樣,即使無人駕駛擁有上萬次的成功駕駛記錄,一次失敗就足以擊潰消費者的信心。

因此,要讓機器人技術真正實用,成功率必須接近 99.99% 甚至更高。然而,每提高 0.001% 的準確率,都需要付出指數級的時間和精力。很多人低估了這最後一步的難度。

Michael 回憶說,2015 年他乘坐谷歌的自動駕駛汽車原型時,曾認為完全自主駕駛指日可待。十年過去了,我們仍在討論何時能夠實現 Level 5 的完全自主性。機器人技術的進步並非線性,而是指數級別的——每前進一步,難度都會大幅增加。這最後的 1% 準確率,可能需要幾年甚至幾十年的時間才能實現。

瓶頸三:硬件的制約

退一步講,即便 AI 模型再強大,現有的機器人硬件也尚未準備好實現真正的自主性。例如,在硬件方面最容易被忽視的問題是缺乏觸覺傳感器——目前最先進的技術,例如 Meta AI 的研究,也遠遠達不到人類指尖的敏感度。人類依靠視覺和觸覺與世界互動,而機器人對於紋理、抓握和壓力反饋幾乎一無所知。

此外,還存在遮擋問題——當物體部分被遮擋時,機器人很難識別和與之互動。而人類即使看不到物體的全貌,也能憑直覺理解它。

除了感知問題,機器人執行器本身也存在缺陷。大多數仿人機器人將執行器直接放置在關節上,導致它們笨重且潛在危險。相比之下,人類的肌腱結構讓動作更平滑、更安全。這也是為什麼現有的仿人機器人看起來僵硬且不靈活。像 Apptronik 這樣的公司正在開發更具生物靈感的執行器設計,但這些創新還需要時間才能成熟。

瓶頸四:硬件擴展的難度

與僅僅依賴計算能力的傳統 AI 模型不同,智能機器人技術的實現需要在現實世界中部署物理設備。這帶來了巨大的資本挑戰。製造機器人成本高昂,只有財力雄厚的大公司才能負擔得起大規模實驗。即使是最經濟高效的仿人機器人,目前的成本也高達數萬美元,大規模普及根本不現實。

瓶頸五:評估有效性的挑戰

這是一個常常被忽略的“隱形”瓶頸。大家可以思考一下,像 ChatGPT 這樣的線上 AI 大模型幾乎可以瞬間測試其功能——一個新的語言模型發布後,全球的研究人員或普通用戶基本上在幾個小時之內就能對它的性能好壞得出結論。但評估物理 AI 需要現實世界的部署,這需要耗費大量時間。

特斯拉的全自動駕駛(FSD)軟件就是一個很好的例子。如果特斯拉記錄了 100 萬英里的行駛里程且沒有發生事故,這是否意味著它真的達到了 Level 5 的自主性?1000 萬英里呢?機器人智能技術的問題在於,唯一驗證其有效性的方法是觀察它最終在哪裡失敗,這意味著需要大規模、長時間的實時部署。

瓶頸六:人力資源的需求

另一個被低估的挑戰是,在機器人 AI 開發過程中,人類勞動力依然不可或缺。僅僅依靠 AI 是不夠的。機器人需要人類操作員提供訓練數據;需要維護團隊保持機器人的運行;以及需要持續不斷的研究人員/開發人員來優化 AI 模型。與可以在雲端訓練的 AI 模型不同,機器人需要持續的人工干預——這也是 DePIN 必須解決的一個主要挑戰。

未來展望:機器人技術的“ChatGPT 時刻”?

有些人認為,機器人技術的 ChatGPT 時刻即將到來。Michael 對此持謹慎態度。考慮到硬件、數據和評估所面臨的挑戰,他認為通用機器人 AI 距離大規模採用還非常遙遠。不過,DePIN 機器人技術的進展確實讓人看到了希望。機器人技術的開發應該是去中心化的,而不是由少數大型企業所掌控。一個去中心化網絡的規模和協調能力能夠分散資本負擔。與其依賴一家大型公司出資製造數千台機器人,不如將願意貢獻的個人納入一個共享網絡之中。

舉例來說,DePIN 可以加速數據收集和評估。與等待一家公司部署有限的機器人收集數據不同,去中心化網絡可以更大規模地並行運行、收集數據。例如,在最近於阿布扎比舉行的一場 AI 與人類機器人競賽中,來自 DeepMind 和 UT Austin 等機構的研究人員將他們的 AI 模型與人類玩家進行了測試。雖然人類仍然佔據上風,但研究人員對從現實世界機器人互動中收集到的獨特數據集感到十分振奮。這從側面證明了對連接機器人技術各個組成部分的子網的需求。研究界的熱情也表明,即使完全自主性仍然是一個長期目標,DePIN 機器人技術已經從數據收集和訓練到現實世界部署和驗證方面展示了切實的價值。

另一方面,AI 驅動的硬件設計改進,例如利用 AI 優化芯片和材料工程,可能會大大縮短時間線。一個具體的例子是 FrodoBot Lab 與其他機構合作,確保了兩盒 NVIDIA H100 GPU——每盒都包含八個 H100 芯片。這為研究人員提供了必要的計算能力,用來處理和優化從機器人部署中收集的現實世界數據的 AI 模型。如果沒有這樣的計算資源,即使是最有價值的數據集也無法充分利用。可見通過 DePIN 去中心化計算基礎設施的訪問,機器人技術網絡可以讓全球的研究人員在不被資本密集的 GPU 所有權所限制的情況下訓練和評估模型。如果 DePIN 能夠成功地眾包數據和硬件進步,機器人技術的未來可能會比預期更早到來。

此外,像 Sam 這樣的 AI 代理(一個帶有 meme 幣的旅行 KOL 機器人)展示了去中心化機器人技術網絡的新盈利模式。Sam 自主運行,24 小時不間斷地在多個城市直播,而它的 meme 幣也在增值。這種模式展示了由 DEPIN 驅動的智能機器人如何通過去中心化所有權和代幣激勵來維持自身財務。未來,這些 AI 代理甚至可以用代幣支付人類操作員的協助、租用額外的機器人資產,或者競標現實世界的任務,從而形成一個既有利於 AI 開發又有利於 DePIN 參與者的經濟循環。

總結:DePIN 機器人技術的未來

機器人 AI 的發展不僅僅取決於算法,還涉及硬件升級、數據積累、資金支持以及人的參與。過去,機器人行業的發展受限於高昂的成本和大型企業的主導地位,使得創新速度受阻。而 DePIN 機器人網絡的建立意味著,借助去中心化網絡的力量,機器人數據收集、計算資源和資本投入可以在全球範圍內協同進行,不僅加速 AI 訓練和硬件優化,還能降低開發門檻,讓更多研究人員、創業者和個人用戶參與進來。我們也期待,機器人行業不再依賴少數科技巨頭,而是由全球社區共同推動,邁向真正開放、可持續的技術生態。

去中心化以太坊实验室

去中心化以太坊实验室

访客