PDF à balisage Extracteur PDF PDF à texte Extracteur de papier académique Document de recherche à texte Plus →

arXiv PDF Extractor

Utilisation commerciale OK 380+ modèles Pas de filigrane Pas besoin d'inscription

Déposez un préprint arXiv, un journal ou un chapitre de thèse — L'IA le convertit en texte laTeX propre. Les équations mathématiques restent comme des équations, les mises en page multicolonnes se détachent, les citations sont conservées. Powered by Meta Nougat-base.

Déposez une préimpression arXiv, nettoyez le texte de LaTeX avec chaque équation rendue en ligne. Les mises en page multicolonnes sont manipulées, les références restent intactes.

Comment utiliser arXiv PDF Extractor

Saisissez votre entrée

Tapez du texte, téléchargez un fichier ou décrivez ce que vous voulez. Aucun compte n'est nécessaire.

Cliquez sur générer

Notre IA traite votre demande en quelques secondes à l'aide des meilleurs modèles open-source.

Télécharger et partager

Téléchargez, copiez ou partagez votre résultat. Gratuit pour un usage personnel et commercial.

Utilisez cet outil via l'API

Automatisez cet outil à partir de votre propre code. Endpoint REST compatible OpenAI, Auth-token auth, pas de SDK supplémentaire requis.

Documentation de l'API Obtenir la clé API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the arXiv PDF Extractor tool on: ..."}]}'

Outils d'IA gratuits connexes

PDF à balisage

Extracteur PDF

PDF à texte

Extracteur de papier académique

Document de recherche à texte

arXiv PDF Extractor — FAQ

Déposer dans une préimpression arXiv et l'IA convertit tout le papier en texte propre LaTeX. Les équations reviennent comme la bonne LaTeX, les mises en page multicolonnes déverrouillées, les références intactes. Construit sur Meta Nougat, formé spécifiquement sur des millions de pages arXiv.

Le corpus d'entraînement de Nougat était arXiv préimpressions — donc il brille absolument sur la famille IEEE / ACM / NeurIPS / ICML / arXiv mise en page. Autres extracteurs PDF étouffent sur les maths multicolonnes; celui-ci a été conçu pour elle.

Téléchargez le PDF depuis arXiv (par exemple arxiv.org/pdf/2401.12345), téléchargez-le ici, récupérez un seul fichier.txt avec le papier complet sous forme de texte LaTeX. Pas de clé d'API arXiv nécessaire; nous avons juste besoin du PDF.

Oui, c'est la caractéristique principale. Les maths en ligne sont `$...$`, les maths sont affichés `$$...$$`. Même les équations raster-rendered dans les journaux plus anciens passent correctement parce que le modèle traite chaque page comme une image.

Auto-handled. Le style à deux colonnes IEEE est la disposition arXiv la plus commune et Nougat le décompresse dans l'ordre de lecture approprié sans drapeau de configuration.

Oui — les marqueurs en ligne `[12]` / `[Smith2020]` restent là où ils appartiennent, et la liste de référence complète à la fin est extraite intacte pour l'utilisation en aval de BibTeX / Zotero.

~8-15 sec/page. Un document de conférence de 12 pages prend ~2-3 min. NeurIPS-style 30+ pages papiers avec des appendices: 8-12 min. Soumettre et marcher loin.

300 jetons/page, étage 600. La plupart des documents de conférence arXiv (8-15 pages) sont 2.400-4.500 jetons. Pool gratuit quotidien couvre ~1-2 papiers/jour pour les utilisateurs signés; les régimes payés obtiennent illimité.

Feed it to ChatGPT / Claude for "explain this paper", build personal RAG over your saved papers, semantic-search your reading list, copiez des équations dans votre propre projet LaTeX, ou lisez le papier en texte simple sur votre téléphone.

Oui — Nougat OCRs interne. arXiv a été rendu LaTeX depuis plus de 25 ans, de sorte que la plupart des préimpressions sont numériques propres.

PDF supprimés juste après l'extraction. La sortie LaTeX est maintenue 24h (anonyme) / 7 jours (lien de partage payant). Jamais utilisé pour la formation. arXiv PDFs sont publics CC-BY de toute façon, mais nous ne les stockons pas d'une manière ou d'une autre.

Oui — POST multipart `file` à /v1/document/academic-pdf/. Réponse JSON avec `text_url`, `pages`, `preview`, `tokens`, `share_url`. Bearer auth (sk-free-...) donne 10K jetons gratuits/mois. /api/ pour l`exemple de boucle.

Inscrivez-vous gratuitement pour 30 000 jetons

Créer un compte gratuit

Aucune carte de crédit requise

Comment évalueriez-vous cet outil?

arXiv PDF Extractor

Résultat

Comment utiliser arXiv PDF Extractor

Saisissez votre entrée

Cliquez sur générer

Télécharger et partager

Utilisez cet outil via l'API

Outils d'IA gratuits connexes

arXiv PDF Extractor — FAQ

Qu'est-ce que l'extracteur arXiv PDF?

Pourquoi arXiv spécifiquement?

Comment l'utiliser?

Les équations arrivent?

Ordre de lecture multicolonnes?

Des citations conservées?

Vitesse?

Prix?

Que puis-je faire avec la sortie?

Les PDF d'arXiv sont-ils pris en charge?

La vie privée?

API?

Obtenez 10 000 jetons gratuits

Attendez — Obtenez 10 000 jetons gratuits!

Tu en veux plus?