MinerU 是上海人工智能实验室 OpenDataLab 开源的文档解析工具,能把 PDF、网页、电子书中的图文、公式、表格高质量地转换成 Markdown/JSON,特别适合为大模型训练和 RAG 知识库准备干净的语料。
适合做 RAG、数据清洗和语料构建的开发者与研究者。
- PDF/网页转 Markdown/JSON
- 保留公式、表格结构
- 为大模型与 RAG 备料
数据统计
数据评估
关于MinerU特别声明
本站AI之旅导航提供的MinerU都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由AI之旅导航实际控制,在2026年5月30日 上午9:49收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,AI之旅导航不承担任何责任。
相关导航
暂无评论...
