當前位置:首頁 > 新聞 > 文化 > 正文

從圖書館「搬」到網路平台 數字技術讓古籍「觸手可及」

2023-07-13 08:53 作者:dl001   來源:人民網-人民日報海外版   閱覽:

  輸入網址、輕點滑鼠,儒家經典《論語》可逐頁線上閱覽,飄逸俊秀的漢隸代表作《曹全碑》書法躍然眼前,古籍還能實現繁體字和簡體字轉換等功能,讓讀者能查詢、會閱讀。專家認為,中華古籍浩如煙海,對珍貴古籍進行保護、修復和活用,關乎中華文脈的延續和傳承。隨著數字技術不斷成熟,古籍正走出「深閨高閣」,資源會得到更有效利用。
從圖書館「搬」到網路平台
  點擊瀏覽器,進入一個名為「識典古籍」的網站,記者看到《周易》《左傳》《禮記》等典籍陳列在首頁上。隨機點開一本,左側為章節目錄,右側為正文,排版形式既符合現代人的閱讀習慣,又還原了古籍紙張的閱讀美感。
  這是北京大學數字人文研究中心與字節跳動合作研發的一個數字古籍平台,自去年10月發布以來,已上線古籍1200餘部,免費供公眾瀏覽。
  與一些數字化平台僅提供古籍影像不同,點擊該平台的功能按鈕,還能實現簡繁體轉換、圖文對照、全文檢索、支持移動端等服務。北京大學人工智慧研究院副研究員楊浩介紹,該平台應用了文字識別、自動標點等技術,不僅將影印本上的文字提取整理,還可以標記文本中的人名、地名等資訊。「我們利用人工智慧技術,將古籍由以前的圖像加工成可檢索的文本與數據,方便研究者、用戶直接閱讀。」
  隨著數字技術不斷成熟,科技賦能古籍工作取得可喜進展。國家圖書館公佈的數據顯示,全國已累計線上發布古籍數字資源13萬部(件)。打開《永樂大典》高清影像數據庫(第一輯),讀者能瀏覽到國家圖書館館藏的《永樂大典》40冊、75卷的高清圖像及相關知識;浙江大學打造的「智慧古籍平台」可線上查閱數萬篇古籍,還有著者小傳、人物行跡及社會網路關係圖等延伸資訊。
  這些古籍是怎樣從圖書館庫房「搬」到網路平台的?楊浩介紹,古籍數字化過程分為兩步。首先將古籍進行掃描。古籍掃描使用專用非接觸式掃描儀,通過高像素照相機,盡量不按壓古籍頁面進行拍照;採用的光源是防紫外線的LED燈冷光源,減少對古籍的損害。其次是對圖像做數據化處理,利用人工智慧技術對文字進行識別,對標點、實體等進行標引,方便讀者閱讀與檢索。
  減少人工智慧識別錯誤率也很重要。字節跳動公益古籍項目相關負責人說,具有中文、歷史等專業知識並對古籍感興趣的員工,自發成立2600人的志願者團隊,參與古籍校對工作。
方便讀者獲取資源
  「作為再生性保護的重要手段,古籍數字化及其平台建設意義重大。」北京大學數字人文中心主任王軍認為,古籍數字化可以很好地解決古籍保護與利用之間的矛盾。傳統上,人們要利用古籍,必須直接接觸書籍,這可能導致書籍受到進一步磨損,且只能在特定的圖書館或機構中閱讀。通過數字化,不僅能減少對古籍的物理損害,還方便讀者隨時隨地獲取這些資源。
  近年來,古籍數字化和平台建設進展很快。國家圖書館搭建的「中華古籍資源庫」已成為全國古籍資源類型和品種最多、體量最大的綜合性資源共享發布平台。中華書局的「中華經典古籍庫」已發布6000多種、15億字的點校本古籍。一些地方還打造了整理少數民族古籍的數字平台,如「廣西古籍文庫」目前共收錄100多部古壯族文字古籍底本和近千份民族地區文書等資源。
  不過,古籍數字化工作依然任重道遠。業內人士指出,中國現存古籍中,只有少部分被拍攝成圖像資料,而大部分未實現文本數字化。此外,大量古籍分散收藏在各個圖書館或收錄于不同的數據庫,難以進行高效檢索、關聯閱讀和深度挖掘與利用。
  如何將這些散落的古籍整合起來?6月初,一個旨在對2.5萬種古籍進行數字化整理的古籍智慧圖書館項目啟動。該項目到2025年底,將實現國家圖書館等館藏古籍數字化,並為人們提供公益性閱讀服務。
短視訊再現古籍裡的美食
  「沒想到古籍這麼『香』。」在看完系列短視訊《食光機·隨園私房菜》後,有網友留言說。該短視訊由南京圖書館歷史文獻研究館研究員史星宇和韓超製作,他們按照清代文學家袁枚寫的《隨園食單》,再現古籍裡的美食,吸引不少人觀看。
  「為了更好地呈現《隨園食單》中的菜品,我們結合曆史和古代文學等相關學科背景,對原文文本一起推敲斟酌,在烹飪上反複試驗,同時盡量還原書中的烹飪手法,保證菜品的原汁原味。」韓超說。
  如何讓數字化的古籍和人們更親近呢?這考驗著文保機構、科研院校與互聯網公司等相關從業者的創新能力。如紀錄片《古籍尋遊記》運用交互技術、掃描技術等,讓用戶以更沉浸的方式體驗甲骨文刻字、建造敦煌莫高窟的過程。
  王軍認為,在古籍數字化、活化過程中,人文社科學者要積極介入,並加強與技術人員合作;高校古典文獻學等相關專業應培養兼具技術與學術能力的複合型人才,部分古籍內容應向著「數字文創」轉化,讓古籍更好地走進千家萬戶。
彭訓文

最近关注

热点内容

更多