arXiv PDF Extractor

Utilisation commerciale OK 380+ modèles Pas de filigrane Pas besoin d'inscription
Modèle:
+ GPT-5, Claude, Gemini
Déposez un préprint arXiv, un journal ou un chapitre de thèse — L'IA le convertit en texte laTeX propre. Les équations mathématiques restent comme des équations, les mises en page multicolonnes se détachent, les citations sont conservées. Powered by Meta Nougat-base.

Déposer un document de recherche PDF ici ou cliquer pour télécharger

PDF jusqu'à 50 Mo. ~300 jetons par page (mathématiques).

équations de lecture + colonnes de décompression... ~10 sec/page
Options avancées
Résultat
Les jetons sont bas. Obtenez plus de jetons
Vous voulez de meilleurs résultats? Modèles premium (GPT-5, Claude, Gemini) offrent une qualité supérieure. Afficher les plans

❤️ Love this tool? Share it!

Inscrivez-vous pour obtenir un lien de référence et gagner 25 000 jetons par ami.

Tu en veux plus? Inscrivez-vous gratuitement pour 30K jetons/jour + 10K bonus
Inscription gratuite

Traitement de votre demande...

Déposez une préimpression arXiv, nettoyez le texte de LaTeX avec chaque équation rendue en ligne. Les mises en page multicolonnes sont manipulées, les références restent intactes.

Comment utiliser arXiv PDF Extractor

1
Saisissez votre entrée

Tapez du texte, téléchargez un fichier ou décrivez ce que vous voulez. Aucun compte n'est nécessaire.

2
Cliquez sur générer

Notre IA traite votre demande en quelques secondes à l'aide des meilleurs modèles open-source.

3
Télécharger et partager

Téléchargez, copiez ou partagez votre résultat. Gratuit pour un usage personnel et commercial.

Utilisez cet outil via l'API

Automatisez cet outil à partir de votre propre code. Endpoint REST compatible OpenAI, Auth-token auth, pas de SDK supplémentaire requis.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the arXiv PDF Extractor tool on: ..."}]}'

arXiv PDF Extractor — FAQ

Déposer dans une préimpression arXiv et l'IA convertit tout le papier en texte propre LaTeX. Les équations reviennent comme la bonne LaTeX, les mises en page multicolonnes déverrouillées, les références intactes. Construit sur Meta Nougat, formé spécifiquement sur des millions de pages arXiv.

Le corpus d'entraînement de Nougat était arXiv préimpressions — donc il brille absolument sur la famille IEEE / ACM / NeurIPS / ICML / arXiv mise en page. Autres extracteurs PDF étouffent sur les maths multicolonnes; celui-ci a été conçu pour elle.

Téléchargez le PDF depuis arXiv (par exemple arxiv.org/pdf/2401.12345), téléchargez-le ici, récupérez un seul fichier.txt avec le papier complet sous forme de texte LaTeX. Pas de clé d'API arXiv nécessaire; nous avons juste besoin du PDF.

Oui, c'est la caractéristique principale. Les maths en ligne sont `$...$`, les maths sont affichés `$$...$$`. Même les équations raster-rendered dans les journaux plus anciens passent correctement parce que le modèle traite chaque page comme une image.

Auto-handled. Le style à deux colonnes IEEE est la disposition arXiv la plus commune et Nougat le décompresse dans l'ordre de lecture approprié sans drapeau de configuration.

Oui — les marqueurs en ligne `[12]` / `[Smith2020]` restent là où ils appartiennent, et la liste de référence complète à la fin est extraite intacte pour l'utilisation en aval de BibTeX / Zotero.

~8-15 sec/page. Un document de conférence de 12 pages prend ~2-3 min. NeurIPS-style 30+ pages papiers avec des appendices: 8-12 min. Soumettre et marcher loin.

300 jetons/page, étage 600. La plupart des documents de conférence arXiv (8-15 pages) sont 2.400-4.500 jetons. Pool gratuit quotidien couvre ~1-2 papiers/jour pour les utilisateurs signés; les régimes payés obtiennent illimité.

Feed it to ChatGPT / Claude for "explain this paper", build personal RAG over your saved papers, semantic-search your reading list, copiez des équations dans votre propre projet LaTeX, ou lisez le papier en texte simple sur votre téléphone.

Oui — Nougat OCRs interne. arXiv a été rendu LaTeX depuis plus de 25 ans, de sorte que la plupart des préimpressions sont numériques propres.

PDF supprimés juste après l'extraction. La sortie LaTeX est maintenue 24h (anonyme) / 7 jours (lien de partage payant). Jamais utilisé pour la formation. arXiv PDFs sont publics CC-BY de toute façon, mais nous ne les stockons pas d'une manière ou d'une autre.

Oui — POST multipart `file` à /v1/document/academic-pdf/. Réponse JSON avec `text_url`, `pages`, `preview`, `tokens`, `share_url`. Bearer auth (sk-free-...) donne 10K jetons gratuits/mois. /api/ pour l`exemple de boucle.

Inscrivez-vous gratuitement pour 30 000 jetons

Créer un compte gratuit

Aucune carte de crédit requise

Comment évalueriez-vous cet outil?

Love this tool? Share it!