登录

PDF/DOCX/HTML/扫描文档解析不再愁!D自动解析文档并统一格式的开源库edoc

G
GitHubStore
·8 分钟深度阅读·2,854
"

内容摘要

Dedoc 是一个开放的通用系统,用于将文档转换为统一的输出格式。它提取文档的逻辑结构和内容:表格、文本格式和元数据。文档的内容以树的形式表示,存储任意级别的标题和列表。Dedoc 可以作为文档内容和结构分析系统中的一个独立模块进行集成。

暂无 AI 重组内容

全文结束

🌍

加入技术社区

关注公众号获取全网最新鲜的 AI 开源项目精选,或添加微信与同行大咖共同探讨前沿技术。

GitHubStore 公众号
微信公众号
添加微信
技术交流群

项目讨论区0

加载中...