arXiv PDF 抽出
商用OK
380+モデル
透かしなし
登録は不要
モデル:
+ GPT-5, Claude, Gemini
arXiv の予備版、論文、論文章を削除して、AI がそれを清潔な LaTeX 風のテキストに変換します。数学的方程式は方程式として残り、多列レイアウトは巻き戻され、引用は保存されます。Meta Nougat-base で動作します。
方程式を読み込む + 列を巻き戻す... ~10 秒/ページ
追加オプション
結果
証券が足りない
もっとトークンを取得
もっと欲しい?
無料登録で1日30Kトークン+10Kボーナス
無料登録
ご要望を処理中...
arXiv のプリプリントを捨て、すべての方程式をインラインでレンダリングした清潔な LaTeX 風のテキストを得ます。多列レイアウトを扱い、参照はそのままにします。フリーで、AI を駆使しています。
使い方 arXiv PDF 抽出
1
入力を入力
テキストを入力、ファイルをアップロード、または必要なことを記述します。アカウントは必要ありません。
2
クリックして生成
私たちのAIは、最良のオープンソースモデルを使って、あなたの要求を数秒で処理します。
3
ダウンロードと共有
結果をダウンロード、コピー、共有できます。個人的、商業的な使用は無料です。
このツールを API で使用
あなたのコードからこのツールを自動化します。OpenAI 互換の REST エンドポイント、ベアートークン認証、追加の SDK が必要ありません。トークンのコストはウェブインターフェースと一致します。
curl -X POST https://api.free.ai/v1/chat/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the arXiv PDF 抽出 tool on: ..."}]}'
関連するフリーAIツール
arXiv PDF 抽出 — FAQ
arXiv のプリプリントを入力すると、AI は論文全体を清潔な LaTeX 風のテキストに変換します。方程式は正しい LaTeX として返され、多列レイアウトは巻き戻され、参照は無傷です。Meta Nougat 上に構築され、数百万の arXiv ページで特別に訓練されています。
Nougatの訓練コーパスはarXivのプリプリントでした。それで、IEEE/ACM/NeurIPS/ICML/arXivレイアウトファミリーに絶対に優れています。他のPDF抽出器は多列数学で窒息します。このものはそれに対して設計されています。
arXiv からPDFをダウンロードし、ここにアップロードして、LaTeX テキストとして全文を含む単一の.txtファイルを返します。arXiv API キーは必要ありません。PDFだけが必要です。
はい、それはヘッダの特徴です。インライン数学は '$...$'、表示数学は '$$...$$'です。古い論文のラスターレンダリングされた方程式も正しく表示されます。モデルは各ページを画像として扱うので、正しく表示されます。
2列のIEEEスタイルは最も一般的なarXivレイアウトであり、Nougatはそれをコンフィグフラグなしで適切な読み順に分解します。
はい - 行内の `[12]` / `[Smith2020]` マーカーはその場所に残り、最後の全参考文献リストは下流の BibTeX / Zotero 用に無傷で抽出されます。
1ページあたり8〜15秒 12ページの会議論文は2〜3分かかる NeurIPSのような30ページ以上の論文は8〜12分かかる 提出して退場
ほとんどの arXiv 会議論文(8-15ページ)は2,400-4,500 ポイントである。 無料プールはログインユーザのために毎日約 1-2 論文をカバーします。有料プランは無制限になります。
ChatGPT / Claudeにフィードして「この論文を説明」するか、保存した論文を使って個人的なRAGを作成し、読書リストの意味的検索を行い、方程式を自分のLaTeXプロジェクトにコピーしたり、携帯電話で論文をプレーンテキストとして読むことができます。
はい — Nougat OCR は内部で実行されます。arXiv は 25 年以上 LaTeX でレンダリングされていますので、ほとんどのプリプリントはクリーンなデジタルです。古いスキャンされた論文は動作しますが、数学的な忠実度はわずかに低下します。最良の結果を得るには 300+ DPI で再スキャンしてください。
PDF は抽出後すぐに削除されます。LaTeX 出力は 24 時間 (匿名) / 7 日 (有料共有リンク) 保存されます。トレーニングには使用されません。arXiv PDF はどちらにしてもパブリック CC-BY ですが、どちらにしても保存しません。
はい — 多重ファイルを /v1/document/academic-pdf/ に POST します。 JSON 応答は text_url, pages, preview, tokens, share_url です。 持ち主認証 (sk-free-…) は 10K のフリートークン/月を与えます。 curl の例は /api/ です。
このツールをどう評価しますか?