大型語言模型可讓機器人更自主

2023-03-09 11:08 作者：陸行健來源：德國柏林工業大學閱覽：

　　日前，由美國谷歌公司和德國柏林工業大學的人工智慧研究團隊推出了史上最大的視覺語言模型——PaLM-E，參數量高達5620 億（GPT-3的參數量為 1750億）。作為一種視覺語言模型，PaLM-E不僅可以理解圖像，還能理解、生成語言，執行各種複雜的機器人指令而無需重新訓練；同時，它還展示出了強大的湧現能力。可見，大型語言模型(LLM)可讓機器人更自主。
　　據稱，當得到一個高級命令，如「把抽屜里的洋芋片拿給我」，PaLM-E可為帶有手臂的移動機器人平台（由谷歌公司開發）生成一個行動計畫，並自行執行這些行動。PaLM-E通過分析來自機器人攝像頭的數據來實現這一目標，而無需對場景進行預處理。這消除了人類對數據進行預處理或註釋的需要，使機器人控制更加自主。
　　PaLM-E還很有彈性，能對環境做出反應。例如，PaLM-E模型可引導機器人從廚房裡拿一袋洋芋片，由於 PaLM-E集成到了控制迴路中，它對任務中可能發生的中斷有了抵抗力。在一個視訊例子中，一名研究人員從機器人手中抓起洋芋片並移動牠們，但機器人找到了洋芋片並再次抓起牠們。
　　近日，美國微軟公司的研究團隊發表了一篇名為《機器人ChatGPT：設計原則和模型能力》論文，公佈了他們正在把ChatGPT應用於機器人上的研究成果。該文稱，這項研究的目標是觀察ChatGPT是否可超越文本思考，並對物理世界進行推理來幫助完成機器人任務。
　　ChatGPT是一種基於大量文本和人類交互語料庫而訓練的語言模型，使其能夠對各種提示和問題生成連貫且文法正確的響應。人類目前仍然嚴重依賴手寫代碼來控制機器人。微軟研究團隊一直在探索如何改變這一現實，並使用ChatGPT來實現自然的人機交互。
　　研究人員希望ChatGPT能幫助人們更輕鬆地與機器人互動，而無需學習複雜的編程語言或有關機器人系統的詳細資訊。ChatGPT解鎖了一種新的機器人範式，並允許潛在的非技術用戶在循環中，在監控機器人性能的同時向LLM提供高級反饋。
　　作為人工智慧技術產品，PaLM-E和ChatGPT將會越來越多地應用到機器人學領域中。正如國際知名學者周海中先生在20世紀90年代初所言：「隨著科技進步，人工智慧時代即將到來；屆時，人工智慧技術將廣泛應用到各學科領域，會產生意想不到的效果。」
　　文/陸行健(作者系德國柏林工業大學博士後)

大型語言模型可讓機器人更自主

最近关注

臺灣李尚哲勇奪第九屆“華燦獎”最高獎項“

專家略談｜人工智能技術與預測學研究

专家略谈｜人工智能技术与预测学研究

人工智慧時代的到來，有哪些工作難以代替？

人工智能时代的到来，有哪些工作难以代替？

热点内容