<table id="pivur"><center id="pivur"><source id="pivur"></source></center></table>
  • <track id="pivur"><ruby id="pivur"></ruby></track>

  • <p id="pivur"><del id="pivur"><xmp id="pivur"></xmp></del></p>

      <acronym id="pivur"></acronym>
    1. <table id="pivur"><strike id="pivur"></strike></table>
      用戶登錄投稿

      中國作家協會主管

      數字化,激活古籍生命力
      來源:人民日報 | 張賀  2023年10月03日10:00

      圖①:浙江湖州嘉業堂藏書樓俯瞰。

      張 斌攝

      圖②:山西第一期古籍修復培訓班上,學員聽專家講解相關知識。

      本報記者 陳 斌攝

      圖③:《永樂大典》數字高清影像庫項目工作人員進行古籍數字化處理。

      邵啟軒攝

      圖④:《永樂大典》數字高清影像庫。

      邵啟軒攝

      古籍記錄歷史、傳承文化,是中華文明源遠流長、博大精深的表征和見證。隨著古籍數字化步伐的加快,實現全部古籍永久保存的目標有望實現。越來越多收藏在圖書館里的珍貴古籍走出“象牙塔”,走進社會大眾。古籍數字化的持續推進,讓古籍面貌煥然一新,不斷激發古籍生命力?!盎钇饋怼钡墓偶找娉蔀閭鞒兄腥A優秀傳統文化、堅定文化自信的寶貴滋養。

      古籍數字化帶來閱讀便利

      什么是“天頭地腳”?什么是“象鼻”?什么是“魚尾”?……打開識典古籍網站《永樂大典》數字高清影像庫,點擊這些看起來有些陌生的名詞,《永樂大典》高清圖片上相應的位置立刻突出顯示,直觀而形象地展現這部珍貴古籍的風采。更令讀者感興趣的是,網頁上的《永樂大典》可以隨著鼠標調整方向和角度,360度觀賞,仿佛是拿著真書在閱讀。

      “這是我們的專利技術,用光影變化最大限度地模擬實體書的閱讀體驗,最大限度地保存古籍原貌?!弊R典古籍項目產品負責人王宇說。

      《永樂大典》數字高清影像庫是國家圖書館承接的國家古籍數字化重點項目,由北京大學數字人文中心和字節跳動公司共同設計研發。該項目第一輯收錄國家圖書館館藏《永樂大典》40冊、75卷的內容,除呈現《永樂大典》高清圖像、整體風貌及相關知識外,還嘗試對部分大典內容做了知識標引,為后續《永樂大典》的知識體系化、利用智能化進行探索。

      “數字化解決了存藏和使用之間的矛盾?!眹覉D書館副館長、國家古籍保護中心副主任張志清說。因古籍年代久遠、極易破損,珍貴古籍的借閱有一整套嚴格的流程,普通讀者是難以接近的?!凹垑矍辍?,每一次翻閱都是對古籍的傷害?!肮偶當底只葴p少了紙書的磨損,也使《永樂大典》這部寶貴文獻‘化身千百’‘走入尋常百姓家’,從而弘揚中華優秀傳統文化,推動相關學術研究,感知《永樂大典》的不朽神韻?!睆堉厩逭f。

      除了讓珍貴古籍走近普通讀者,數字化也降低了古籍的閱讀門檻。

      在識典古籍網站和客戶端上,《論語》《孟子》等常見古籍不僅有文本,而且有古籍原本影像,圖文左右對照;有注疏和翻譯,文白對照;不僅可以閱讀,還可以檢索?!澳壳拔覀兂醪桨讶嗣?、地名和官職等實體進行了標注,也上線了字典釋義功能,鼠標或手指放到不認識的字詞上,就會顯示注釋。下一步還要把實體標注與百科詞條鏈接起來,遇到不懂的問題,點擊即可呈現詳細解釋?!蓖跤钫f,通過數字化降低古籍閱讀門檻,可以讓更多讀者親近古籍,感受中華優秀傳統文化的魅力。

      作為面向大眾的公益性古籍數字化平臺,目前識典古籍已上線古籍1600余部,免費對公眾開放。讀者對于數字化的古籍表現出很高的閱讀熱情,短短數月,識典古籍累計用戶數已超過1240萬。

      面向專業用戶的古籍數據庫建設步伐也在加快。中華書局下屬古籍數字化企業古聯公司開發的古籍整理出版資源平臺籍合網,自2018年上線以來,已發布數據庫31個,涵蓋專業古籍整理出版資源20億字,石刻資源5萬余篇,歷代登科人物10萬余條,木版年畫18000余幅,書法作品10000余種,甲骨文卜辭143856條,總計字符30多億。

      自2012年以來,我國古籍事業進入新時代,古籍數字化不斷提速。2022年4月,中共中央辦公廳、國務院辦公廳印發《關于推進新時代古籍工作的意見》,明確提出“推進古籍數字化”,強調“支持古籍數字化重點單位做強做優,加強古籍數字化資源管理和開放共享?!薄兑庖姟愤M一步激發了相關單位古籍數字化的動力,以大型圖書館為主體的公藏單位普遍開展了古籍數字化工作。

      今年9月,國家圖書館組織第八次古籍數字資源聯合發布,新增發布古籍資源1672部(件)。至此,全國累計發布古籍及特藏文獻影像資源達13萬余部(件)。

      不過,在快速發展的同時,古籍數字化還存在薄弱之處。據統計,我國現存古籍約20萬種5000多萬冊(件),但實現數字化的不超過8萬種,大多數所謂數字化古籍只是完成了初步的影像掃描,真正實現文本數字化的不足4萬種。

      古籍數字化專家呂亞峰說,古籍影像掃描是古籍數字化的基礎,但影像無法檢索;只有數字化文本才可以檢索,便于研究、閱讀和傳播。因此,今后古籍數字化工作應把重點放在古籍文本的數字化上?!艾F在有了人工智能等先進技術,加速實現全部古籍的數字化已經具備了條件?!眳蝸喎逭f。

      “如果現存古籍全部數字化,那么我國古籍保護就邁上了一個新臺階,古籍滅失的可能性就大幅降低了。這對于賡續中華文脈,將是一個了不起的貢獻?!睆堉厩逭f,“我們所處的新時代,有史以來,中華民族第一次有可能實現文化典籍永久保護和傳承?!?/p>

      古籍數字化進入人工智能時代

      將古籍高清影像上傳服務器,點擊自動識別按鈕,只見古籍影像上立刻出現一個個不斷閃動的格子,自動套住圖片上的每個字,相應的文字就按照古籍上文字的排列順序出現在頁面。這一過程不過數秒。

      “人工智能在古籍數字化中的應用有效提升了古籍整理的效率?!惫怕摴究偨浝砗闈f,以籍合網OCR(光學字符識別技術)識別為例,5分鐘的OCR識別相當于人工錄入20小時的工作量,而且錯誤可以降低75%?!斑@對傳統紙本古籍整理效率的提升是巨大的,”洪濤說,人工智能解決了大型古籍整理項目耗時耗力、過久過多的現狀。

      以西泠印社“刻在石頭上的浙江”系列叢書為例,古聯公司編輯部參與了包括《東甌金石志》等在內的9種金石類古籍的整理,共計約147萬字。在整理過程中,全流程利用智能整理技術輔助工作。首先用OCR識別底本文字,然后采用線上眾包模式開展底本校對工作。校對后的稿件通過自動標點功能進行標點,標點后的稿件再交由編輯進行??焙屯ㄗx審稿。在這種工作模式下,編輯部僅用時4個月就完成了全部稿件的整理工作和部分編輯工作?!斑@樣的速度在以前是不可想象的,只有在人工智能時代才能成為現實?!焙闈f。

      人工智能正在變得越來越“聰明”,現在對版刻本的識別準確率可達98%。即使對行夾注、眉批、行間批注、表格等不規則的古籍版面,不僅能準確識別文字,還能通過針對性訓練優化分區效果,從而避免出現雖然單字識別正確,但閱讀順序顛倒錯亂不能復用的情況。

      以往給古籍斷句和加標點,需要經驗豐富的專業人士手動進行。但現在人工智能可以實現機器自動斷句、自動標點。洪濤介紹,目前研發的自動標點技術,斷句準確率平均達到98.46%,標點準確率達到93.94%,專名線書名線自動標注準確率達到92.15%,標點標線后的古籍文本更方便閱讀、理解和研究。

      “如果人工智能不介入,完全依靠人力,古籍數字化全部完成可能還需要上百年的時間,但有了人工智能,完成全部古籍的數字化也許只要二三十年。我們對此有信心?!蓖跤钆e例說,百衲本《二十四史》將近4000萬字,但利用人工智能,識典古籍北大整理團隊僅用3個多月就完成了識別、點校、上線發布。

      盡管經過人工智能處理的古籍文本準確率已經很高,但依然需要人工核校。特別是一些異體字、冷僻字,以及特殊格式的古籍,更是離不開專業古籍工作者的核校。

      “人工智能并不能完全取代人,人工智能的優勢在速度,而人的優勢在精確和創造性。通過人機協同、人機互補,可以大幅提高古籍整理出版的效率和質量。而高質量的、學術性的古籍整理工作依然需要專家學者長期不懈的努力,不可能被計算機所替代?!焙闈f。

      古籍整理進入大眾化時代

      古籍整理是專業性很強的工作,但在人工智能高速發展的今天,古籍愛好者也可以參與古籍整理。其流程大致是這樣的——

      經過人工智能處理的古籍文本,通過互聯網分發給在線編校人員,后者在電腦上對照古籍底本高清圖像,逐字逐句審閱,并在古籍整理平臺上修改。管理員借助平臺的版本比對功能審閱修改記錄,判斷是否合格。

      古聯公司建立的全國第一個古籍整理眾包平臺正是這樣運作的。從2018年上線以來,籍合網古籍整理眾包平臺積累了近5000人的在線古籍編校隊伍。這些在線古籍編校者絕大多數都是業余人士,有大學生、圖書編輯、律師、教師,也有公務員、金融界人士、自由職業者等。愛好文史、熟悉互聯網是他們的共同特征。

      全書近2億字的《中華大藏經·續編》通過眾包模式,在全球900多位業余審校者的參與下,僅用時兩年就完成了兩個校次的底本校對與審核工作?!肮偶肀姲ぷ髂J讲粌H解決了大型古籍整理項目在人力方面的需求,更重要的是解決了地域限制和個體時間分散、隨意的難題,使人力和時間都得到了充分的利用?!焙闈f。

      “青年一代對中華傳統文化的認知和熱愛,是推動古籍事業高質量發展的重要推力?!睆堉厩逭f。

      目前,一支2300余人的古籍志愿者隊伍活躍在字節跳動公司。每次識典古籍發布古籍審校任務,志愿者們就會在群里認領,往往是“秒光”。手速稍慢,任務就被人領走了。

      古籍志愿者許黧丹參與了《茶苑》和《雞足山志》兩部古籍的文字校對和結構整理任務?!坝H自參與,大受震撼,完全顛覆了我的認知。原來,只是輕輕滑動鼠標就能瀏覽到的內容,背后凝結著這么多復雜的步驟和這么多人的心血?!痹S黧丹說,“除了為古籍數字化做出自己的微薄貢獻,還結交了志同道合的朋友,自己也增長了不少見識。我們都在期待下一次的古籍整理任務了?!?/p>

      在人工智能的幫助下,未來的古籍數字化還會有怎樣的進展?

      洪濤認為,目前的古籍數字化僅僅是一個開始,未來可以利用人工智能進行古籍的輯佚、匯編、注解、翻譯、檢索、索引甚至考證和摘要工作。而更重要的是,利用人工智能開發古籍,用古籍蘊含的浩瀚素材創作生成內容。

      “比如,創作一部歷史題材的影視劇就可以讓人工智能從古籍里尋找相關素材,自動生成故事。創作者在此基礎上繼續修改。這個過程不斷循環,就能創作出高質量的作品。我們離這一天已經越來越近了。從這個意義上說,中華古籍是一座寶藏?!焙闈f。

      国产精品自产拍高潮在线|偷窥盗摄一区二区|亚洲精品无码午夜福利中文字幕|精品熟女少妇av免费久久
      <table id="pivur"><center id="pivur"><source id="pivur"></source></center></table>
    2. <track id="pivur"><ruby id="pivur"></ruby></track>

    3. <p id="pivur"><del id="pivur"><xmp id="pivur"></xmp></del></p>

        <acronym id="pivur"></acronym>
      1. <table id="pivur"><strike id="pivur"></strike></table>