PDF 转 Markdown 解析器 — 公式、表格、代码块完整保留
将 PDF 智能转换为可编辑的 Markdown,支持表格处理与多语言翻译
上传 PDF 文件
将文件拖拽至此处,或
仅支持 PDF,最大 300MB,最多 800 页
处理设置
花费说明
- • PDF解析:2 积分/页
- • PDF解析+Markdown翻译:3 积分/页
PDF 转 Markdown 的工作方式
KolmoPDF 使用视觉语言模型(VLM)分析 PDF 页面,并输出结构化 Markdown,尽量保留文档的语义内容。
解析器可处理的内容
- 多栏布局: 双栏或更多分栏页面会按正确的逻辑阅读顺序解析,而不是按页面物理位置从左到右硬读。
- 数学公式: 行内与独立公式会以 Markdown 中的 LaTeX 形式输出,例如
$E = mc^2$or$$\int_0^\infty e^{-x^2} dx$$. - 表格: 表格可输出为 Markdown 表格,或保留为图片。实验性的跨页表格合并功能会检测并合并跨页表格。
- 代码块: 源代码和技术符号会被包裹为围栏代码块,并在可识别时附带语言提示。
- 翻译: 可在解析时同步把文档内容翻译为中文、日语、韩语、法语、德语、西班牙语或俄语。额外增加 1 积分/页。
文件限制
仅支持 PDF 文件。最大文件大小 300 MB,最大页数 800 页。
PDF 转 Markdown 解析器能做什么
KolmoPDF 基于面向学术论文、技术书籍和工程文档训练的视觉语言模型(VLM),把技术 PDF 解析成结构化 Markdown。它保持多栏阅读顺序、识别行内与展示形式的 LaTeX 公式、重建跨页表格、保留代码块。输出的纯 Markdown 可直接接入静态站点、知识库和后续翻译流程。
核心能力
- 支持行内与展示形式 LaTeX 公式识别,处理多行公式。
- 稳定识别合并单元格、跨页延续的表格。
- 把两栏 / 三栏页面按线性阅读顺序重排。
- 识别代码块,对可识别源代码标注语言提示。
- 解析时可一次性翻译到 8 种目标语言。
常见使用场景
研究者用它从论文中提取 LaTeX 进入笔记系统。工程团队把 Markdown 写入 Confluence、Notion、内部 wiki。本地化团队把 Markdown 喂给翻译记忆库。教师从教材 PDF 重建讲义和习题,无需手动重打公式。
常见问题
扫描版 PDF 也能解析吗?
可以。视觉语言模型把文本视为图像区域,原生 PDF 和扫描 PDF 走同一条解析路径。
每页多少积分?
PDF 解析每页 2 积分;解析 + 翻译每页 3 积分。新用户注册即送 100 积分。
文件大小上限?
免费与付费方案都支持最大 300 MB 的文件,页数上限取决于剩余积分。