PDFエクストラクタ PDF からテキスト学術論文抽出研究論文からテキスト arXiv PDF 抽出もっと →

PDFからMarkdownへ

Q: 数学/方程式をどう扱うのですか。

数学的な研究論文のために、 特に方程式と引用に特化した学術論文抽出ツール (Nougat) を提供しています。

Q: どれくらい速い？

30ページの報告は約3〜5分である。

Q: いくらですか。

500トークンで 1ページあたり200トークン 5ページの契約は 1000トークン 30ページのレポートは 6000トークン 5Kの日々のフリープールは ほとんどの一般的な使用に対応します

Q: どんな入力フォーマット？

PDF — born-digital + scanned 両方サポート。最大50MBのアップロード。他の文書フォーマット (DOCX、EPUB、HTMLなど) もロードマップにあります。今はまず pdf-conversion ツールでアップロードして変換してください。

商用OK 380+モデル透かしなし登録は不要

PDFを削除 — AI はそれをヘッダ、段落、リスト、表、コードブロックを保存した、GitHub風 Markdown に変換します。 IBM Granite-Docling-258M (Apache 2.0) で動作します。単純なテキスト抽出よりも速く、賢くなります。

ヘッダ、表、リスト、コードブロックを保存した、GitHub風の Markdown に変換します。IBM Granite-Docling による。無料、無制限、登録不要。

使い方 PDFからMarkdownへ

入力を入力

テキストを入力、ファイルをアップロード、または必要なことを記述します。アカウントは必要ありません。

クリックして生成

私たちのAIは、最良のオープンソースモデルを使って、あなたの要求を数秒で処理します。

ダウンロードと共有

結果をダウンロード、コピー、共有できます。個人的、商業的な使用は無料です。

このツールを API で使用

あなたのコードからこのツールを自動化します。OpenAI 互換の REST エンドポイント、ベアートークン認証、追加の SDK が必要ありません。トークンのコストはウェブインターフェースと一致します。

APIドキュメント API キーを取得

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDFからMarkdownへ tool on: ..."}]}'

PDFからMarkdownへ — FAQ

どんなPDFでもドラッグして、AIはそれをGitHub風の Markdownに変換します。ヘッダはヘッダ、表は表、リストはリスト、コードブロックはコードブロックになります。単純なテキスト抽出を超えて、文書の構造階層は保存され、出力を直接ドキュメントサイト、LLM RAGパイプライン、検索インデックスにドラッグできます。

IBM Granite-Docling-258M (Apache 2.0)。レイアウトに合った文書変換のために微調整された小さなビジョンからシーケンスへのモデル。pdftotextを打ち破り、ページごとに一般的なビジョン言語モデルを実行するよりもずっと速く、賢くなります。

pdftotextはフラットダンプで、段落と表は単語の壁に崩れ落ちる。Adobe Export to Wordはレイアウトを保持するが、.docx形式のファイルを生成する。費用は月額約15ドルである。DoclingはSEMANTIC構造を保持し、LLMやdevツールがネイティブで消費できるフォーマットで出力する。

LlamaParseとunstructuredは両方とも無料の階層を持つが、月間ページ数制限があり、APIキーが必要です。Docling-258MはGPU上でローカルで動作します。+は完全に自己ホストのApache 2.0で、ページごとの計量はありません。キーのサインアップもありません。標準文書ではLlamaParseと品質が競合します。

複雑な多列/ネストされたテーブルはより攻撃的に平坦化されます。 (モデルの過ちではなく、基本的な Markdown の制限)。完璧なテーブル忠実性のために、 rowspan/colspan を保存する API を介して `format=html` もサポートしています。

Granite-Docling は OCR ステップを自動的に行います。デジタルで作成された PDF とスキャンした PDF は同じです。低い DPI (<150) でスキャンするとテキストの正確性が少し失われます。最良の結果を得るには 200+ DPI で再スキャンしてください。

数学的な研究論文のために、特に方程式と引用に特化した学術論文抽出ツール (Nougat) を提供しています。

30ページの報告は約3〜5分である。

500トークンで 1ページあたり200トークン 5ページの契約は 1000トークン 30ページのレポートは 6000トークン 5Kの日々のフリープールはほとんどの一般的な使用に対応します

PDF — born-digital + scanned 両方サポート。最大50MBのアップロード。他の文書フォーマット (DOCX、EPUB、HTMLなど) もロードマップにあります。今はまず pdf-conversion ツールでアップロードして変換してください。

すぐに処理され、Markdown 出力は保持されます (24時間匿名 / 7日有料共有リンクの有効期限)、ソース PDF は抽出後すぐに削除されます。訓練には使用しません。 /privacy/ の全体のポリシーを参照してください。

はい — 多分割ファイルを /v1/document/pdf-to-markdown/ に POST します。返します {markdown_url, pages, preview, tokens, share_url}。持ち主認証 (sk-free-…) は 10K のフリートークン/月を与えます。 /api/ には curl の例があります。

1万枚のトークンで無料登録

無料アカウントを作成

クレジットカードは必要ありません

このツールをどう評価しますか？

PDFからMarkdownへ

結果

使い方 PDFからMarkdownへ

入力を入力

クリックして生成

ダウンロードと共有

このツールを API で使用

関連するフリーAIツール

PDFからMarkdownへ — FAQ

AI PDF to Markdown は何ですか？

どのモデルの電源？

これは pdftotext / Adobe エクスポートとどう違うのですか？

LlamaParse/unstructured.ioとはどう違うのですか？

テーブルを扱うのか？

スキャンしたPDFはどうですか？

数学/方程式をどう扱うのですか。

どれくらい速い？

いくらですか。

どんな入力フォーマット？

アップロードした PDF は保存されますか？

APIはあるのか？

10,000 無料トークンを取得

待ってくれ 10Kのフリートークンをもらえ

もっと欲しい？