中国古籍文字自动识别挑战 2021 

中国古籍文字自动识别挑战 2021 

简介

中文文字自动识别是数码学术中的重要一环,也是对中国古籍文本分析研究的第一步。香港中文大学图书馆现举办「中国古籍文字自动识别挑战 2021」,诚邀相关研究者及机构等参与。图书馆希望透过此网上竞赛比较各家对古籍中文字自动识别方案的优异,研究者或业界亦可藉此观摩交流,让中国古籍文字自动识别技术进一步提升,并推动学界对中文资料的发掘,为相关学科的研究开创新里程。 

挑战竞赛详情及规则 

時間表

2021年2月8日 (星期一)公布挑战竞赛详情及开始报名
2021年3月1日 (星期一)截止报名
2021年3月4日 (星期四)线上简介会
2021年3月17 – 30日网上竞赛 (每天一挑战,为期10天)
2021年4月2日 (星期五)公布得奖名单
2021年4月7日 (星期三)结果网页公布优胜名单
2021年4月21日 (星期三) 网上颁奖礼及冠军技术简报

参赛资格及报名

不限地区, 欢迎各界以团队或个人名义参加。 请到 https://bit.ly/3rp1ULH 报名。截止日期为2021年3月1日 (星期一)。

参赛准则  

参赛者在竞赛期间,对每日发放的档案进行自动文字识别。大会在参赛者所提供在线用户接口上载及处理当日文字图像文件(TIFF),大会每日竞赛成绩将以代号即日公布。 

评分标准 

文字识别准确度 / 文字次序及处理输出档案时间。 

公布结果与奖项 

每组会于每天收到当日的赛果,同时也会于结果网页以队伍代号公布当日首五名的分数。优胜名单会于结果网页公布,而冠军队伍亦于2021年4月21日 (星期三) 上午10时举行的网上颁奖礼作技术简报。 

奖项: 

冠军: 价值港币8,000元之电子礼券 及 电子奖章
亚军: 价值港币5,000元之电子礼券
季军: 价值港币3,000元之电子礼券 

按此到 结果网页

知识产权 

主办单位保留一切原始来源档案所有权,参赛者只可在此竞赛时间内授权使用档案。参赛者在未经主办单位授权下不得使用原始来源档案作其他用途。参赛者缴交参赛文本文件之版权归主办单位所有。 

参赛者需保证参赛档案所使用之技术或程序,均属参赛者原创或已取得合法授权,若有任何第三者提出侵害知识产权或其他违法事项指控,必须由参赛者自行处理,并自负一切法律上之责任。 

鸣谢

特别鸣谢中大道教文化研究中心黎志添教授提供相关文字档。

参赛队伍

以下参赛队伍给予相关联络以利交流有关中文古籍文字识别技术 (排名不分先后):

台灣中央研究院數位文化中心
联络人: 王祥安
电邮: sawang @ gate.sinica.edu.tw
网页: https://www.ascdc.sinica.edu.tw/

陕西师范大学历史文化学院
联络人: 张光伟
电邮: zhangguangwei @ snnu.edu.cn
网页: http://his.snnu.edu.cn/info/1069/8258.htm

深延科技(北京)有限公司
联络人: 陈彬、徐振宇
电邮: chenb1 @ deepblueai.com / xuzy @ deepblueai.com
网页: http://shenyanai.com/

台灣國立台灣大學工程科學與海洋工程所 CKLab
联络人: 黃亁綱教授
团队成员: 王婷、李家名、陳昱安
电邮: ckhuang @ ntu.edu.tw

西安文数保科技有限公司
联络人:  闫升
电邮: sheng.yan @ hengdawb.com

查询

欢迎参阅有关竟赛的常见问题

如对竟赛有任何查询,请发电邮到 dslab@lib.cuhk.edu.hk