古籍历史价值极高,为保存古文物之美,阿里巴巴达摩院、中国四川大学、加州大学柏克莱分校、中国国家图书馆及浙江图书馆等合作,研发古籍数位化,该系统已能识别逾百本古籍,辨识度准确率高达97.5%。
![]() |
|
古籍历史价值极高,为保存古文物之美,阿里巴巴达摩院、中国四川大学、加州大学柏克莱分校、中国国家图书馆及浙江图书馆等合作,研发古籍数位化,该系统已能识别逾百本古籍,辨识度准确率高达97.5%。
北京日报报导,中国古籍全部字符约有数十万,绝大部分不但不被现代字库收录,还会几乎找不到样本供人工智能(AI)学习。达摩院技术团队与四川大学专家,为了解决上述问题,合作研发一套全新的古籍识别系统。
新系统利用单字检测、无监督单字聚类、少样本分类、主动学习等有系统性的机器学习方法。并将会一边识别古籍,一边训练模型,以97.5%的准确率,完成约20万页古籍的整体识别。
目前该系统已经能识别逾百本古籍,并有覆盖逾3万字的古籍字典。随著古籍识别规模增加,机器会不断提升准确率和效率。与专家人工输入相比,将效率提升近30倍。藉“汉典重光”项目将古籍刻本数位化,供公众翻阅、检索。
阿里巴巴达摩院院长张建锋称,阿里计画将这套技术工具连同古籍数位化平台一并捐赠,交由权威公共机构长期运营。守护中华传世典籍,是科技工作者和文化工作者共同的使命。
达摩院成立于2017年10月,既有学术思维,也有产品思维和商业逻辑。阿里巴巴创办人马云曾对达摩院提出三个要求:活得要比阿里巴巴长、服务全世界至少20亿人口、必须面向未来,用科技解决未来的问题。
| 当前新闻共有0条评论 | 分享到: |
|
||||||||||
| 评论前需要先 登录 或者 注册 哦 |
||||||||||||
| 24小时新闻排行榜 | 更多>> |
| 1 | 胡春华署名文章 口吻不寻常 |
| 2 | 翻盘?胡锦涛“幽灵”浮现 |
| 3 | 中国举办全球盛会!西方巨头集体缺席 |
| 4 | 谁偷拍了美女主任? |
| 5 | 他突然接近习近平 中国官员全吓傻视频曝光 |
| 48小时新闻排行榜 | 更多>> |
| 一周博客排行 | 更多>> |
| 一周博文回复排行榜 | 更多>> |