PDF à balisage Extracteur PDF PDF à texte Document de recherche à texte arXiv PDF Extractor Plus →

Extracteur de papier académique

Utilisation commerciale OK 380+ modèles Pas de filigrane Pas besoin d'inscription

Déposez un préprint arXiv, un journal ou un chapitre de thèse — L'IA le convertit en texte laTeX propre. Les équations mathématiques restent comme des équations, les mises en page multicolonnes se détachent, les citations sont conservées. Powered by Meta Nougat-base.

Les équations mathématiques sont converties en LaTeX, les mises en page multicolonnes sont déverrouillées, les citations sont conservées. Propulsé par Meta Nougat. Libre, pas d'inscription.

Comment utiliser Extracteur de papier académique

Saisissez votre entrée

Tapez du texte, téléchargez un fichier ou décrivez ce que vous voulez. Aucun compte n'est nécessaire.

Cliquez sur générer

Notre IA traite votre demande en quelques secondes à l'aide des meilleurs modèles open-source.

Télécharger et partager

Téléchargez, copiez ou partagez votre résultat. Gratuit pour un usage personnel et commercial.

Utilisez cet outil via l'API

Automatisez cet outil à partir de votre propre code. Endpoint REST compatible OpenAI, Auth-token auth, pas de SDK supplémentaire requis.

Documentation de l'API Obtenir la clé API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Extracteur de papier académique tool on: ..."}]}'

Outils d'IA gratuits connexes

PDF à balisage

Extracteur PDF

PDF à texte

Document de recherche à texte

arXiv PDF Extractor

Extracteur de papier académique — FAQ

Déposer dans n'importe quel document académique / de recherche PDF — arXiv préimpression, document de conférence, article de revue, chapitre de thèse — et l'IA le convertit en texte propre formaté LaTeX. Les équations mathématiques viennent à travers comme propre LaTeX, les mises en page multicolonnes sont déveludées dans l'ordre de lecture, et les citations + listes de références sont préservées.

Meta's Nougat-base — un modèle de décodeur-encodeur de vision formé sur des millions de pages arXiv. Il traite chaque page PDF comme une image et des sorties structurée Markdown + LaTeX, c'est pourquoi les équations passent correctement même lorsqu'elles sont rendues comme des glyphes raster dans le PDF source.

Extracteur de papier académique Docling (PDF to Markdown) utilise IBM Granite-Docling — rapide, layout-ware, optimisé pour les documents d'affaires généraux comme les contrats, rapports, manuels. Nougat est plus lent mais FAR mieux sur les documents académiques parce qu'il a été spécialement formé sur les plans scientifiques mathématiques + multicolonne. Utilisez Docling pour les docs d'affaires, Nougat pour la recherche.

Oui, c'est la fonction killer. Les maths inline reviennent comme `$...$`, affichent des équations comme `$$...$$`. Il peut lire les deux équations LaTeX-rendered des soumissions arXiv ET les équations raster scannées à partir d'anciens articles. La qualité est la qualité de publication pour la grande majorité des articles.

Oui — Nougat se débrouille automatiquement en deux colonnes / trois colonnes dans l'ordre de lecture approprié. Plus de texte en saut entre les colonnes. Les notes de bas de page sont extraites dans les blocs de note à la fin de chaque section.

Marqueurs de citation `[12]` / `(Smith 2020)` rester en ligne. Les listes de référence à la fin sont conservées avec le formatage intact, de sorte que vous pouvez piper la sortie dans Zotero / Mendeley / un analyseur de citation personnalisé.

Environ 8-15 secondes par page sur notre H200. Un document de conférence typique de 10 pages fonctionne en ~2 minutes. Les documents d'enquête longs (50+ pages) prennent 8-12 minutes — soumettre et marcher.

300 jetons par page (étage 600). Un document de conférence de 10 pages = 3 000 jetons. Un chapitre de thèse de 30 pages = 9 000 jetons.

Pipez-le dans ChatGPT/Claude pour la résumation du papier, construisez un RAG personnel sur un corpus de papiers, faites une recherche sémantique dans votre propre bibliothèque, copiez des équations directement dans les projets LaTeX, ou lisez simplement le papier en texte simple sur votre téléphone.

Oui — Nougat fait sa propre étape OCR. Les soumissions arXiv numériques de naissance sont les meilleures (le rendu de l'équation propre); les vieux papiers scannés fonctionnent aussi mais la fidélité mathématique tombe un peu. Pour les meilleurs résultats mathématiques sur les scans, rescan à 300+ DPI avant le téléchargement.

Traitement immédiat, la sortie texte de LaTeX est conservée (24h anonyme / 7d payé expiration share-link), le PDF source est supprimé juste après extraction. Jamais utilisé pour la formation. /privacy/ pour la politique complète.

Oui — POST a multipart `file` to /v1/document/academic-pdf/. Retourne {text_url, pages, prévisualisation, jetons, share_url}. Le porteur auth (sk-free-...) donne 10K jetons gratuits/mois. /api/ a l'exemple de boucle.

Inscrivez-vous gratuitement pour 30 000 jetons

Créer un compte gratuit

Aucune carte de crédit requise

Comment évalueriez-vous cet outil?

Extracteur de papier académique

Résultat

Comment utiliser Extracteur de papier académique

Saisissez votre entrée

Cliquez sur générer

Télécharger et partager

Utilisez cet outil via l'API

Outils d'IA gratuits connexes

Extracteur de papier académique — FAQ

Quel est Extracteur de papier académique?

Quel modèle l'alimente?

En quoi cela diffère-t-il de Extracteur de papier académique PDF à Extracteur de papier académique Markdown?

Est-ce qu'il gère les équations mathématiques?

Des mises en page multicolonnes?

Qu'en est-il des citations et des références?

C'est à quelle vitesse?

Combien ça coûte?

Que puis-je faire avec la sortie?

Les papiers scannés sont-ils pris en charge?

Est-ce que les PDF téléchargés sont stockés?

Y a-t-il une API?

Obtenez 10 000 jetons gratuits

Attendez — Obtenez 10 000 jetons gratuits!

Tu en veux plus?