PDF 转 Markdown 解析器 — 公式、表格、代码块完整保留

将 PDF 智能转换为可编辑的 Markdown,支持表格处理与多语言翻译

上传 PDF 文件

将文件拖拽至此处,或

仅支持 PDF,最大 300MB,最多 800 页

处理设置

花费说明

  • PDF解析2 积分/页
  • PDF解析+Markdown翻译3 积分/页

PDF 转 Markdown 的工作方式

KolmoPDF 使用视觉语言模型(VLM)分析 PDF 页面,并输出结构化 Markdown,尽量保留文档的语义内容。

解析器可处理的内容

  • 多栏布局: 双栏或更多分栏页面会按正确的逻辑阅读顺序解析,而不是按页面物理位置从左到右硬读。
  • 数学公式: 行内与独立公式会以 Markdown 中的 LaTeX 形式输出,例如 $E = mc^2$ or$$\int_0^\infty e^{-x^2} dx$$.
  • 表格: 表格可输出为 Markdown 表格,或保留为图片。实验性的跨页表格合并功能会检测并合并跨页表格。
  • 代码块: 源代码和技术符号会被包裹为围栏代码块,并在可识别时附带语言提示。
  • 翻译: 可在解析时同步把文档内容翻译为中文、日语、韩语、法语、德语、西班牙语或俄语。额外增加 1 积分/页。

文件限制

仅支持 PDF 文件。最大文件大小 300 MB,最大页数 800 页。

PDF 转 Markdown 解析器能做什么

KolmoPDF 基于面向学术论文、技术书籍和工程文档训练的视觉语言模型(VLM),把技术 PDF 解析成结构化 Markdown。它保持多栏阅读顺序、识别行内与展示形式的 LaTeX 公式、重建跨页表格、保留代码块。输出的纯 Markdown 可直接接入静态站点、知识库和后续翻译流程。

核心能力

常见使用场景

研究者用它从论文中提取 LaTeX 进入笔记系统。工程团队把 Markdown 写入 Confluence、Notion、内部 wiki。本地化团队把 Markdown 喂给翻译记忆库。教师从教材 PDF 重建讲义和习题,无需手动重打公式。

常见问题

扫描版 PDF 也能解析吗?

可以。视觉语言模型把文本视为图像区域,原生 PDF 和扫描 PDF 走同一条解析路径。

每页多少积分?

PDF 解析每页 2 积分;解析 + 翻译每页 3 积分。新用户注册即送 100 积分。

文件大小上限?

免费与付费方案都支持最大 300 MB 的文件,页数上限取决于剩余积分。