當前位置:首頁 > 新聞 > 社會 > 正文

重視聊天機器人背後的語言知識與倫理

2022-12-14 08:49 作者:饒高琦   來源:光明日報   閱覽:

  最近一段時間,人工智慧和互聯網領域最火的話題莫過於智能對話系統「生成式預訓練模型聊天機器人」(ChatGPT,暫譯,以下簡稱「聊天系統」)。該系統不僅支持包括中文在內的多語聊天,而且還能夠扮演角色,甚至執行編程。對於或詼諧或嚴肅的提問,它的表現令人感到驚豔:相當多的知識內容正確,語言表達更是流暢,並且還支持多輪連續聊天。因此,不少人感慨「自己已經沉迷於和它對話」「讓它替我編程、寫稿,效率提昇」,甚至有人用它生成了某行業的諮詢報告,通過對話引導它生成的書也在亞馬遜線上出版。但在聊天系統流暢交談的表面下,其對人類知識的掌握仍不可靠。隨著測試的增加,也有越來越多的人感慨它「常常一本正經地胡說八道」。錯誤資訊以純熟的語言表達出來,因而更加隱蔽。但無論如何,在不少人認定本輪人工智慧泡沫開始破碎的時間點,它的誕生無疑是給人們打了一劑「強心針」。
  人工智慧所涉任務眾多,語言智能卻越來越成為方法、技術、應用方面的領先領域。正如聊天系統對自己的介紹:「我是一個語言模型。」該系統得以駕馭極其廣泛的知識內容,來自對互聯網文本內容的獲取和「理解」,進而形成了自己的「知識體系」。其中所涉技術十分複雜,但它的成功無疑以十分直觀的方式向我們展示了語言之於人類知識乃至人類思維的重要性。人工智慧的核心在於知識的獲取、表示和運用,語言無疑是其中關鍵。教科書上「語言是人類最重要的思維工具」「人類九成的知識由語言承載」的論斷在人工智慧系統的應用上得到了淋漓盡致的展現。知識和思維的承載物是語言,因而也賦予語言無可替代的資源屬性。智能技術的發展和落地,頻繁向傳統語言學的教育和研究發出信號:構建語言資源、挖掘語言中的知識、探索語言知識的形式表達,是最切中數字社會命脈的發展方向。
  當然,正如過去幾十年中任何一項智能技術的成熟落地一樣,聊天系統也引起了一波「失業潮」的輿論。這樣的擔心實不必要。過去幾十年裡,智能技術成熟引起的「失業潮」幾乎從未出現,短期內或許會攪動局部行業,但長期來看卻相反。技術應用本身也催生了大量新崗位,例如聊天系統的研製本身依賴於海量的人工數據標註和反饋,數據標註師和測試員崗位需求巨大。
  更深層次來看,與聊天系統強大的語言生成能力不匹配的是它對知識的真正掌握程度。大量模棱兩可乃至錯誤的資訊混雜在流暢的對話中,反而令其更加難以被發現。誠如清華大學馬少平教授所說:「人工智慧最大的問題是不知道自己不知道什麼,也不知道自己真知道什麼,什麼問題都能回答,結果如何就不得而知了。」在一般性知識極易獲取,複雜知識參差不齊的背景下,人類專家的專業判斷力和經過思考加工的準確回答,更顯彌足珍貴。人工智慧諸多技術「黑箱」帶來的不確定性,終究還需要人類專業、全局判斷來化解。從這個層面上講,「自知」的人類永遠不可或缺。
  也恰恰因為技術「黑箱」的存在,人類才需要不斷從自身、從技術去尋求可靠、可信的技術和技術使用方式。可信的人工智慧、可信計算成為融合技術、倫理的重要領域,並受到越來越多的重視。更宏觀的人工智慧倫理和治理工作也早已被納入科技管理的視野。挽救「失足系統」,矯正「智能體歧視」也許不再是比喻,而將成為使用者、從業者和治理者都必須面對的問題。
(作者:饒高琦,係北京語言大學漢語國際教育研究院助理研究員)

最近关注

热点内容

更多