本发明的实施例公开了一种纸件文档的数据化处理方法及装置。包括:对待分类纸件文档的内容进行处理,提取所述待分类纸件文档的关键信息;在文档类型信息库中确定与所述关键信息匹配的标准信息,将所述标准信息所属的文档类型确定为所述待分类纸件文档的文档类型;基于所述文档类型对应的结构化版式以及所述待分类纸件文档的内容,生成所述待分类纸件文档的结构化信息;将所述待分类纸件文档、所述待分类纸件文档的文档类型以及所述结构化信息进行关联存储。能够实现对文档的自动分类与自动文档著录,替代人工操作,具有更高的准确率与处理效率,使文档数据更为具体和细化。 |