2022 中国古籍文字自动识别挑战

2022 中國古籍文字自動識別挑戰 

主办机构:香港中文大学图书馆研究支援及数码创新部 及 台湾中央研究院数位人文中心

简介

为推广有关中文古籍文字自动识别技术的发展及交流,香港中文大学图书馆数码创新部于去年首办了「中国古籍文字自动识别挑战 2021」,吸引全球二十三队不同界别人士报名挑战。为继续推广交流相关技术发展,促进数码学术研究,本年度与首届冠军 – 台湾中央研究院数位文化中心 (ASCDC) 合办「2022中国古籍文字自动识别挑战」,盼能将中文古籍的文字自动识别技术再进一步。 

挑战竞赛详情及规则

時間表

2022年2月14日 (星期一)开始报名
2022年4月7日 (星期四)线上简介会
2022年4月14日 (星期四)截止报名
2022年5月3-17日网上竞赛 (每天一挑战,为期10个工作天)
2022年5月23日 (星期一)公布得奖名单
2022年6月6日 (星期一)网上颁奖礼及得奖队伍技术简报

参赛资格及报名

本届分为学生组公开组,不限地区,欢迎各界以团队或个人名义参加:

  • 学生组:成员需为现正就读于任何院校之学生,团体组别最多只容许一位教研人员加入
  • 公开组:没有限制

请到 https://bit.ly/3rp1ULH (2022年2月14日 (星期一) 开始) 报名,报名时需填写队伍资料及有关技术简介。截止日期为 2022年4月14日 (星期四)。

参赛准则  

参赛队伍需自行提供平台,大会会在其平台介面上载及处理当日文字图像档(TIFF) ,因此参赛者需确保于竞赛期间能顺利于限时内对每日上传发放的中文古籍图档进行自动文字识别及供大会下载识别文字档。每日竞赛成绩将以代号即日公布。

评分标准 

于限时内对文字识别准确度与输出文字顺序。 

公布结果与奖项 

每组将会于每日个别收到当日的赛果,同时结果网页亦会以队伍代号公布当日首三名的分数。优胜名单会于结果网页公布,而得奖队伍需于网上颁奖礼作技术简报及交流。 

奖项: 

学生组 & 公开组成绩最好三队均设奖励:

冠军: 价值港币8,000元之电子礼券 及 电子奖章
亚军: 价值港币5,000元之电子礼券
季军: 价值港币3,000元之电子礼券 

按此到 结果网页

颁奖礼及得奖队伍简报:

知识产权 

主办单位保留一切原始来源档案所有权,参赛者只可在此竞赛时间内授权使用档案。参赛者在未经主办单位授权下不得使用原始来源档案作其他用途。参赛者缴交参赛文本文件之版权归主办单位所有。 

参赛者需保证参赛档案所使用之技术或程序,均属参赛者原创或已取得合法授权,若有任何第三者提出侵害知识产权或其他违法事项指控,必须由参赛者自行处理,并自负一切法律上之责任。 

参赛队伍

以下参赛队伍给予相关联络以利交流有关中文古籍文字识别技术 (排名不分先后):

北京大学
联络人: 林弼远
电邮: linbeyoung @ stu.pku.edu.cn

河南文数保智能科技研究院
联络人:  闫升
电邮: sheng.yan @ hengdawb.com

查询

欢迎参阅有关竟赛的常见问题

如对竟赛有任何查询,请发电邮到 dslab@lib.cuhk.edu.hk