當前位置:首頁 > 新聞 > 文化 > 正文

用人工智慧技術保護瀕危語言

2020-08-25 22:17 作者:蔡莉      閱覽:


瀕危語言(圖片源自網路)

據聯合國教科文組織(UNESCO)發布的《瀕危語言圖譜》顯示,全世界有7000種民族語言(通常稱為「母語」),其中一半以上將在本世紀消亡,80%至90%將在未來200年滅絕。平均每兩個星期就有一種民族語言消失。據統計,世界80%的人講83種主要語言,剩下6000多種語言絕大多數從沒有過文字記載,牠們很可能成為瀕危語言甚至消亡語言。

然而,德國著名哲學家馬丁·海德格爾先生曾經說過:語言是存在的家園。中國著名學者周海中先生也曾經指出:保護民族語言,有利於人類文明的傳承和發展,也有利於民族團結、社會安定。可以說,民族語言不僅是民族存在的最重要的特徵之一,也是民族文化傳承、發展、繁榮的重要載體,更是人類文明進步和社會和諧穩定的重要標誌。

隨著部分民族語言以驚人的速度滅絕,瀕危語言的使用者正與時間賽跑,利用現代科技,尤其是人工智慧技術將他們獨特的語言文字傳給下一代。前不久,美國著名未來學家托馬斯·弗雷先生提出了「全球語言檔案館」的設想;他利用了人工智慧技術把不同的民族語言以視訊、音頻和書面文件的方式存檔。目前,弗雷先生已經聯合世界各地的學者收集了近4000種語言的數據,其中許多是瀕危語種。

在中國,科大訊飛利用人工智慧技術尋找瀕危語言中不同尺度的音節語義之間的關聯和模式,在超強算力的伺服器的協同配合下,最終形成語音庫,實現了瀕危語言的留存。憑藉先進的智能語音技術,該公司覆蓋多個少數民族語言及方言的語音系統已經在語音輸入法、翻譯機、自動評測以及播報中得到實際應用,進一步推進民族語言、地方方言的保護和傳承,為維護語言生態多樣性做出了貢獻。

加拿大第一民族文化委員會(FPCC)最近為了支持不列顛哥倫比亞省的土著語言、藝術、文化和遺產的復興,它利用人工智慧技術,通過其First Voice平台保存語言數據,製作出教學程式和應用程式。First Voice是一款鍵盤應用程式,可讓用戶在行動裝置上的任何應用程式里輸入超過100種當地土著語言,包括社交媒體、電子郵件和文字處理。

澳大利亞的語言學家與美國谷歌合作,最近開發出瀕危語言人工智慧平台;該平台通過人工智慧模型轉錄原住民語言,已存儲超過4萬小時的錄音。這不僅節省了大量的時間,而且還提高了記錄的準確率。目前,他們已經為20多種澳大利亞土著語言建立了人工智慧模型。

紐西蘭的語言學家與美國IBM的「沃森人工智慧」合作,最近開發出幫助愛好者練習土著語言「毛利語」的人工智慧程式Reobot;該程式不僅能用英語和毛利語回復資訊,還能過濾拼寫錯誤甚至文法錯誤。有專家認為,Reobot可以幫助學習者更快地培養自信和技能。

由於人工智慧技術在語言存儲和學習方面的優勢,現在它在拯救瀕危語言的過程中變得空前重要。不過,想通過這一技術使這些語言得以保護還面臨很大的挑戰,例如許多土著語言一般是通過口述的方式進行傳承,如果將其轉化為文字,可能會改變或者無法完整地表達其原本含義。但是我們可以相信,在現代科技,尤其是人工智慧技術的助力下,瀕危語言的保護問題一定能夠得以解決。

文/蔡莉(作者單位:德國馬普學會人類歷史科學研究所)

最近关注

热点内容

更多