PDF を Markdown へ変換 — 数式・表・コードを忠実に保持
文字、数式や図表をMarkdown形式に変換し、解読可能に。多言語翻訳をサポートします。
PDFをアップロード
ファイルをドラッグ&ドロップ、または
PDFのみ, 最大 300MB, 最大 800頁
設定
ポイント使用説明
- • PDF解析:2 pt/頁
- • PDF解析+MD翻訳:3 pt/頁
PDF から Markdown への変換の仕組み
KolmoPDF は視覚言語モデル(VLM)で PDF ページを解析し、文書の意味構造を保ったまま構造化 Markdown を出力します。
解析できる内容
- 多段組レイアウト: 2 段以上のページでも、物理的な左から右ではなく、正しい論理的な読順で解析します。
- 数式: インライン数式とディスプレイ数式は Markdown 内で LaTeX として出力されます。例:
$E = mc^2$or$$\int_0^\infty e^{-x^2} dx$$. - 表: 表は Markdown テーブルとして出力するか、画像のまま保持できます。実験的な跨ページ表結合機能は、ページをまたぐ表を検出して結合します。
- コードブロック: ソースコードや技術記法は fenced code block にまとめられ、判定できる場合は言語ヒントも付与されます。
- 翻訳: 解析中に文書内容を中国語、日本語、韓国語、フランス語、ドイツ語、スペイン語、ロシア語へ翻訳できます。1 ページあたり 1 pt 追加されます。
ファイル制限
PDF ファイルのみ対応。最大ファイルサイズは 300 MB、最大ページ数は 800 ページです。
PDF → Markdown 変換ツールの機能
KolmoPDF は学術論文・技術書・エンジニアリング文書で学習した Visual Language Model を使い、技術系 PDF を構造化された Markdown に変換します。複数段組の読み順を保持し、インラインおよびディスプレイ形式の LaTeX 数式を認識し、ページをまたぐ表を再構築し、コードブロックをそのまま保存します。出力はクリーンな Markdown で、静的サイト・ナレッジベース・翻訳パイプラインに直接流せます。
主な機能
- インラインとディスプレイ形式の LaTeX 数式認識、複数行数式に対応。
- セル結合・ページ跨ぎの表を安定して認識。
- 2 段組・3 段組ページを線形の読み順に並び替え。
- コードブロックを検出し、識別可能なら言語ヒント付き。
- 解析と同時に 8 言語へワンパス翻訳が可能。
主な利用シーン
研究者は論文から LaTeX を抽出してノートシステムに取り込みます。エンジニアリングチームは Markdown を Confluence・Notion・社内 wiki に流し込みます。ローカライズチームは翻訳メモリツールに直接渡せます。教員は教科書 PDF から数式を打ち直さずに講義資料を再構築できます。
よくある質問
スキャン PDF にも対応しますか?
はい。Visual Language Model はテキストを画像領域として扱うため、ネイティブ PDF とスキャン PDF を同じパイプラインで処理します。
1 ページあたりのコストは?
PDF 解析は 1 ページ 2 ポイント、翻訳付きで 3 ポイントです。新規登録で 100 ポイントを贈呈します。
ファイルサイズの上限は?
無料・有料プランとも最大 300 MB に対応します。ページ数の上限は残ポイントによります。