拟对图片型PDF电子书而自动化做思维导图笔记1、用双层orc识别。2、根据段落空格两个字段、断句分列等规则,对PDF内容做分类分级,3、按照层级放入各节点内容内4、最终导出图片or文档。断句分列——分类分级规则1:把每一个自然段作为父节点(首行缩进两个字符)每一自然段的句号or分号(视为断句分列)作为子节点。不断细分而衍生孙节点。。。如此类推断句分列——分类分级规则2“一、二、三、”作为爷节点,“(一)(二)(三)”作为父节点,“1、2、3”作为子节点“(1)(2)(3)”作为孙节点so求软件推荐or封装python完整代码(以后仅需替换电子书储存地址即可实现)
请选择举报理由 垃圾广告! 低俗色情! 人身攻击! 疑似水军评论! 其他有害!
最少输入10个字
拟对图片型PDF电子书而自动化做思维导图笔记
1、用双层orc识别。
2、根据段落空格两个字段、断句分列等规则,对PDF内容做分类分级,
3、按照层级放入各节点内容内
4、最终导出图片or文档。
断句分列——分类分级规则1:
把每一个自然段作为父节点(首行缩进两个字符)
每一自然段的句号or分号(视为断句分列)作为子节点。
不断细分而衍生孙节点。。。如此类推
断句分列——分类分级规则2
“一、二、三、”作为爷节点,
“(一)(二)(三)”作为父节点,
“1、2、3”作为子节点
“(1)(2)(3)”作为孙节点
so求软件推荐or封装python完整代码(以后仅需替换电子书储存地址即可实现)
请选择举报理由