arXiv PDF 抽出

商用OK 380+モデル 透かしなし 登録は不要
モデル:
+ GPT-5, Claude, Gemini
arXiv の予備版、論文、論文章を削除して、AI がそれを清潔な LaTeX 風のテキストに変換します。数学的方程式は方程式として残り、多列レイアウトは巻き戻され、引用は保存されます。Meta Nougat-base で動作します。

ここに研究論文のPDFをドラッグまたはクリックしてアップロード

50MBまでのPDF。 ページ当たり約300トークン(数学に関心がある)。

方程式を読み込む + 列を巻き戻す... ~10 秒/ページ
追加オプション
結果
証券が足りない もっとトークンを取得
もっと良い結果が欲しいのか? プレミアムモデル また,高品質の画像を得るためには,画像の解像度を高くする必要がある。 プランを表示

❤️ Love this tool? Share it!

紹介リンクを得て 友達1人につき25,000トークンを稼ぐために

もっと欲しい? 無料登録で1日30Kトークン+10Kボーナス
無料登録

ご要望を処理中...

arXiv のプリプリントを捨て、すべての方程式をインラインでレンダリングした清潔な LaTeX 風のテキストを得ます。多列レイアウトを扱い、参照はそのままにします。フリーで、AI を駆使しています。

使い方 arXiv PDF 抽出

1
入力を入力

テキストを入力、ファイルをアップロード、または必要なことを記述します。アカウントは必要ありません。

2
クリックして生成

私たちのAIは、最良のオープンソースモデルを使って、あなたの要求を数秒で処理します。

3
ダウンロードと共有

結果をダウンロード、コピー、共有できます。個人的、商業的な使用は無料です。

このツールを API で使用

あなたのコードからこのツールを自動化します。OpenAI 互換の REST エンドポイント、ベアートークン認証、追加の SDK が必要ありません。トークンのコストはウェブインターフェースと一致します。

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the arXiv PDF 抽出 tool on: ..."}]}'

arXiv PDF 抽出 — FAQ

arXiv のプリプリントを入力すると、AI は論文全体を清潔な LaTeX 風のテキストに変換します。方程式は正しい LaTeX として返され、多列レイアウトは巻き戻され、参照は無傷です。Meta Nougat 上に構築され、数百万の arXiv ページで特別に訓練されています。

Nougatの訓練コーパスはarXivのプリプリントでした。それで、IEEE/ACM/NeurIPS/ICML/arXivレイアウトファミリーに絶対に優れています。他のPDF抽出器は多列数学で窒息します。このものはそれに対して設計されています。

arXiv からPDFをダウンロードし、ここにアップロードして、LaTeX テキストとして全文を含む単一の.txtファイルを返します。arXiv API キーは必要ありません。PDFだけが必要です。

はい、それはヘッダの特徴です。インライン数学は '$...$'、表示数学は '$$...$$'です。古い論文のラスターレンダリングされた方程式も正しく表示されます。モデルは各ページを画像として扱うので、正しく表示されます。

2列のIEEEスタイルは最も一般的なarXivレイアウトであり、Nougatはそれをコンフィグフラグなしで適切な読み順に分解します。

はい - 行内の `[12]` / `[Smith2020]` マーカーはその場所に残り、最後の全参考文献リストは下流の BibTeX / Zotero 用に無傷で抽出されます。

1ページあたり8〜15秒 12ページの会議論文は2〜3分かかる NeurIPSのような30ページ以上の論文は8〜12分かかる 提出して退場

ほとんどの arXiv 会議論文(8-15ページ)は2,400-4,500 ポイントである。 無料プールはログインユーザのために毎日約 1-2 論文をカバーします。有料プランは無制限になります。

ChatGPT / Claudeにフィードして「この論文を説明」するか、保存した論文を使って個人的なRAGを作成し、読書リストの意味的検索を行い、方程式を自分のLaTeXプロジェクトにコピーしたり、携帯電話で論文をプレーンテキストとして読むことができます。

はい — Nougat OCR は内部で実行されます。arXiv は 25 年以上 LaTeX でレンダリングされていますので、ほとんどのプリプリントはクリーンなデジタルです。古いスキャンされた論文は動作しますが、数学的な忠実度はわずかに低下します。最良の結果を得るには 300+ DPI で再スキャンしてください。

PDF は抽出後すぐに削除されます。LaTeX 出力は 24 時間 (匿名) / 7 日 (有料共有リンク) 保存されます。トレーニングには使用されません。arXiv PDF はどちらにしてもパブリック CC-BY ですが、どちらにしても保存しません。

はい — 多重ファイルを /v1/document/academic-pdf/ に POST します。 JSON 応答は text_url, pages, preview, tokens, share_url です。 持ち主認証 (sk-free-…) は 10K のフリートークン/月を与えます。 curl の例は /api/ です。

1万枚のトークンで無料登録

無料アカウントを作成

クレジットカードは必要ありません

このツールをどう評価しますか?

Love this tool? Share it!