PDFからMarkdownへ PDFエクストラクタ PDF からテキスト研究論文からテキスト arXiv PDF 抽出もっと →

学術論文抽出

Q: いくらですか。

1ページ300トークン 10ページの会議論文は3000トークン 30ページの論文章は9000トークン 日々のフリープールは ほとんどの研究用の読書に使える

商用OK 380+モデル透かしなし登録は不要

arXiv の予備版、論文、論文章を削除して、AI がそれを清潔な LaTeX 風のテキストに変換します。数学的方程式は方程式として残り、多列レイアウトは巻き戻され、引用は保存されます。Meta Nougat-base で動作します。

arXiv 論文、雑誌、論文からテキストと方程式を引き出します。数学方程式は LaTeX に変換され、多列レイアウトは解読され、引用は保存されます。Meta Nougat で動作します。無料で登録は不要です。

使い方学術論文抽出

入力を入力

テキストを入力、ファイルをアップロード、または必要なことを記述します。アカウントは必要ありません。

クリックして生成

私たちのAIは、最良のオープンソースモデルを使って、あなたの要求を数秒で処理します。

ダウンロードと共有

結果をダウンロード、コピー、共有できます。個人的、商業的な使用は無料です。

このツールを API で使用

あなたのコードからこのツールを自動化します。OpenAI 互換の REST エンドポイント、ベアートークン認証、追加の SDK が必要ありません。トークンのコストはウェブインターフェースと一致します。

APIドキュメント API キーを取得

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the 学術論文抽出 tool on: ..."}]}'

学術論文抽出 — FAQ

学術的な論文や研究論文のPDFファイルをドラッグして、AIがそれをLaTeXで書かれたテキストに変換します。数学的な方程式は正しいLaTeXで表示され、多列レイアウトは読み順に分割され、引用文献と参考文献リストは保存されます。高密度の科学文書のために特別に作られたpdftotext mangelです。

MetaのNougat-base — 数百万のarXivページで訓練されたビジョンエンコーダデコーダモデル。それぞれのPDFページを画像として扱い、構造化されたMarkdown+LaTeXを出力します。これが、ソースPDFでラスターグリフとしてレンダリングされた方程式が正しく出力される理由です。

Docling ツール (PDF から Markdown へ) は IBM Granite-Docling を使用します。これは、契約書、レポート、マニュアルなどの一般的なビジネス文書に最適化された、高速でレイアウトに配慮したツールです。Nougat は遅いですが、学術論文に対しては非常に優れています。数学と多列科学的レイアウトに特化したためです。ビジネス文書には Docling を、研究用には Nougat を使用してください。

はい、これがキラー機能です。インライン数学は `$...$`として返され、表示された方程式は `$$...$$`として返されます。arXiv の提出物から LaTeX でレンダリングされた方程式と、古い論文からスキャンしたラスター方程式の両方を読み取ります。ほとんどの論文の品質は出版用のものです。

はい - Nougat は 2 列/3 列のレイアウトを自動的に正しい読み順に展開します。テキストが文の中央から列間を飛び越えることはなくなります。脚注は各セクションの終わりに脚注ブロックに抽出されます。

引用マーカー `[12]` / `(Smith 2020)` はインラインに残ります。最後の引用リストはフォーマットを保持して通過します。それで出力を Zotero / Mendeley / カスタム引用解析器にパイプできます。

一般的な10ページの会議論文は約２分で終了する。長い調査論文（５０ページ以上）は８〜１２分かかる。提出してから出発する。

1ページ300トークン 10ページの会議論文は3000トークン 30ページの論文章は9000トークン日々のフリープールはほとんどの研究用の読書に使える

論文の要約のためにChatGPT/Claudeにパイプし、論文のコーパス上で個人的なRAGを構築し、自分のライブラリで意味的検索を行い、方程式をLaTeXプロジェクトに直接コピーしたり、単に携帯電話で論文をプレーンテキストとして読んだりできます。

はい — Nougat は独自の OCR ステップを行います。 Born-digital arXiv 提出は最良 (清潔な方程式レンダリング) です。スキャンした古い論文もうまく動作しますが、数学的忠実度は少し低下します。スキャンの数学的結果を最善にするには、アップロードする前に 300+ DPI で再スキャンしてください。

即座に処理され、LaTeX テキスト出力は保持されます (24時間匿名 / 7日有料共有リンクの有効期限)、ソース PDF は抽出後すぐに削除されます。訓練には使用しません。 /privacy/ の全体のポリシーを参照してください。

はい — 複数のファイルを /v1/document/academic-pdf/ に POST します。返します {text_url, pages, preview, tokens, share_url}。持ち主認証 (sk-free-…) は 10K のフリートークン/月を与えます。 /api/ には curl の例があります。

1万枚のトークンで無料登録

無料アカウントを作成

クレジットカードは必要ありません

このツールをどう評価しますか？

学術論文抽出

結果

使い方 学術論文抽出

入力を入力

クリックして生成

ダウンロードと共有

このツールを API で使用

関連するフリーAIツール

学術論文抽出 — FAQ

これは何？

どのモデルの電源？

これは通常の PDF から Markdown への変換ツールとどう違うのですか？

数学の方程式を扱うのか？

多列レイアウト？

引用と参考文献はどうですか。

どれくらい速い？

いくらですか。

出力はどうする？

スキャンした紙はサポートされていますか？

アップロードした PDF は保存されますか？

APIはあるのか？

10,000 無料トークンを取得

待ってくれ 10Kのフリートークンをもらえ

もっと欲しい？

使い方学術論文抽出