中央研究院文字辨識與校對系統之發展與應用

Date & Time
2023/04/13
2:30 pm - 5:30 pm

「中文古籍的文字勘探與處理」系列


王祥安博士    台灣中央研究院數位文化中心技術長、歷史語言研究所研究助技師
黃翰隆先生    台灣中央研究院數位文化中心專案經理

地點: 線上
按此報名

內容簡介:

這個工作坊將介紹「中央研究院文字辨識與校對系統」 (https://ocr.ascdc.tw) 之功能及操作方式。此系統是由中研院數位文化中心運用影像處理與深度學習技術所研發,其中包含了圖像處理、文本版式偵測、文字位置偵測、文字辨識、文本語意預測及依使用者反饋自動修正等核心技術,並透過網頁與資料庫技術來整合這些核心技術,以提供線上服務。

使用者可透過系統上傳文本的影像檔作自動辨識並產生文字。系統也提供人工校對功能,使用者能透過直覺式圖文對照的方式,校正自動辨識的結果,並可將自動辨識或人工校對的結果下載到自己的電腦。

 

講者簡介:

王祥安博士現為台灣中央研究院數位文化中心技術長、歷史語言研究所研究助技師,專長為數位人文、數位典藏、影像文字辨識、機器學習、資料探勘、網站與資料庫技術。
黃翰隆先生為台灣中央研究院數位文化中心專案經理,專長為系統分析與設計、網站與資料庫技術。

 

查詢: dslab@lib.cuhk.edu.hk

 

 

Add to: