-->
共找到 3 个AI工具
点击任意工具查看详细信息
gmft是一个用于将PDF中的表格转换为多种格式的工具包。它轻量级、模块化且性能优越。gmft依赖于微软的Table Transformers,这是众多替代方案中性能最好、最可靠的。gmft无需GPU即可运行,具有高吞吐量,并且安装简便,仅需一行代码即可完成安装。它使用PyPDFium2,因其高吞吐量和宽松的许可证而受到青睐。gmft使用的训练模型TATR在多样化的数据集PubTables-1M上训练,具有高可靠性。
pdfdeal是一个Python封装的Doc2X API工具,它提供了本地PDF处理功能,旨在提高PDF在RAG中的召回率。该工具支持多种输出格式,包括文本、Markdown、PDF等,并且可以自定义OCR语言和使用GPU加速。它还支持Doc2X,该服务每日有500页的免费使用额度,特别擅长表格和公式的识别。
gptpdf是一个利用大型视觉语言模型(如GPT-4o)将PDF文件解析为Markdown格式的工具。它通过PyMuPDF库识别非文本区域,并使用OpenAI API进行内容解析,几乎可以完美地处理排版、数学公式、表格、图片和图表等。平均成本为每页0.013美元,具有高效和低成本的特点。
探索 编程 分类下的其他子分类
768 个工具
465 个工具
368 个工具
294 个工具
140 个工具
85 个工具
66 个工具
61 个工具
AI PDF 是 编程 分类下的热门子分类,包含 3 个优质AI工具