PDFからMarkdownへ PDFエクストラクタ PDF からテキスト学術論文抽出研究論文からテキストもっと →

arXiv PDF 抽出

Q: スピード？

１ページあたり８〜１５秒 １２ページの会議論文は２〜３分かかる ＮｅｕｒＩＰＳのような３０ページ以上の論文は８〜１２分かかる 提出して退場

Q: 価格は？

ほとんどの arXiv 会議論文（8-15ページ）は2,400-4,500 ポイントである。 無料プールはログインユーザのために毎日約 1-2 論文をカバーします。有料プランは無制限になります。

商用OK 380+モデル透かしなし登録は不要

arXiv の予備版、論文、論文章を削除して、AI がそれを清潔な LaTeX 風のテキストに変換します。数学的方程式は方程式として残り、多列レイアウトは巻き戻され、引用は保存されます。Meta Nougat-base で動作します。

arXiv のプリプリントを捨て、すべての方程式をインラインでレンダリングした清潔な LaTeX 風のテキストを得ます。多列レイアウトを扱い、参照はそのままにします。フリーで、AI を駆使しています。

使い方 arXiv PDF 抽出

入力を入力

テキストを入力、ファイルをアップロード、または必要なことを記述します。アカウントは必要ありません。

クリックして生成

私たちのAIは、最良のオープンソースモデルを使って、あなたの要求を数秒で処理します。

ダウンロードと共有

結果をダウンロード、コピー、共有できます。個人的、商業的な使用は無料です。

このツールを API で使用

あなたのコードからこのツールを自動化します。OpenAI 互換の REST エンドポイント、ベアートークン認証、追加の SDK が必要ありません。トークンのコストはウェブインターフェースと一致します。

APIドキュメント API キーを取得

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the arXiv PDF 抽出 tool on: ..."}]}'

arXiv PDF 抽出 — FAQ

arXiv のプリプリントを入力すると、AI は論文全体を清潔な LaTeX 風のテキストに変換します。方程式は正しい LaTeX として返され、多列レイアウトは巻き戻され、参照は無傷です。Meta Nougat 上に構築され、数百万の arXiv ページで特別に訓練されています。

Nougatの訓練コーパスはarXivのプリプリントでした。それで、IEEE/ACM/NeurIPS/ICML/arXivレイアウトファミリーに絶対に優れています。他のPDF抽出器は多列数学で窒息します。このものはそれに対して設計されています。

arXiv からPDFをダウンロードし、ここにアップロードして、LaTeX テキストとして全文を含む単一の.txtファイルを返します。arXiv API キーは必要ありません。PDFだけが必要です。

はい、それはヘッダの特徴です。インライン数学は '$...$'、表示数学は '$$...$$'です。古い論文のラスターレンダリングされた方程式も正しく表示されます。モデルは各ページを画像として扱うので、正しく表示されます。

2列のIEEEスタイルは最も一般的なarXivレイアウトであり、Nougatはそれをコンフィグフラグなしで適切な読み順に分解します。

はい - 行内の `[12]` / `[Smith2020]` マーカーはその場所に残り、最後の全参考文献リストは下流の BibTeX / Zotero 用に無傷で抽出されます。

１ページあたり８〜１５秒１２ページの会議論文は２〜３分かかるＮｅｕｒＩＰＳのような３０ページ以上の論文は８〜１２分かかる提出して退場

ほとんどの arXiv 会議論文（8-15ページ）は2,400-4,500 ポイントである。無料プールはログインユーザのために毎日約 1-2 論文をカバーします。有料プランは無制限になります。

ChatGPT / Claudeにフィードして「この論文を説明」するか、保存した論文を使って個人的なRAGを作成し、読書リストの意味的検索を行い、方程式を自分のLaTeXプロジェクトにコピーしたり、携帯電話で論文をプレーンテキストとして読むことができます。

はい — Nougat OCR は内部で実行されます。arXiv は 25 年以上 LaTeX でレンダリングされていますので、ほとんどのプリプリントはクリーンなデジタルです。古いスキャンされた論文は動作しますが、数学的な忠実度はわずかに低下します。最良の結果を得るには 300+ DPI で再スキャンしてください。

PDF は抽出後すぐに削除されます。LaTeX 出力は 24 時間 (匿名) / 7 日 (有料共有リンク) 保存されます。トレーニングには使用されません。arXiv PDF はどちらにしてもパブリック CC-BY ですが、どちらにしても保存しません。

はい — 多重ファイルを /v1/document/academic-pdf/ に POST します。 JSON 応答は text_url, pages, preview, tokens, share_url です。持ち主認証 (sk-free-…) は 10K のフリートークン/月を与えます。 curl の例は /api/ です。

1万枚のトークンで無料登録

無料アカウントを作成

クレジットカードは必要ありません

このツールをどう評価しますか？

arXiv PDF 抽出

結果

使い方 arXiv PDF 抽出

入力を入力

クリックして生成

ダウンロードと共有

このツールを API で使用

関連するフリーAIツール

arXiv PDF 抽出 — FAQ

arXiv PDFエクストラクタとは何ですか？

なぜarXivを特に選んだのか？

どうやって使うの？

方程式が通る？

複数列読み順?

引用は保存されますか？

スピード？

価格は？

出力はどうする？

スキャンした arXiv PDF はサポートされていますか？

プライバシー？

API？

10,000 無料トークンを取得

待ってくれ 10Kのフリートークンをもらえ

もっと欲しい？