estrattore PDF arXiv

Uso commerciale OK 380+ modelli Nessuna filigrana Nessuna registrazione necessaria
Modello:
+ GPT-5, Claude, Gemini
Lasciare un arXiv preprint, carta di giornale, o il capitolo di tesi IA converte in pulito LaTeX-saporato testo. Equazioni matematiche rimanere come equazioni, multi-colonne layout ottenere non capovolto, citazioni conservate. Powered by Meta Nougat-base.

Lasciare una carta di ricerca PDF qui o fare clic per caricare

PDF fino a 50 MB. ~300 gettoni per pagina (math-aware).

Equazioni di lettura + colonne di srotolamento... ~10 sec/page
Opzioni avanzate
Risultato
I token sono bassi. Ottenere più token
Vuoi risultati migliori? Modelli premium (GPT-5, Claude, Gemini) forniscono una qualità superiore. Visualizza Piani

❤️ Love this tool? Share it!

Registrati per ottenere un link di referral e guadagnare 25.000 gettoni per amico.

Ne vuoi ancora? Iscriviti gratis per 30K gettoni al giorno + 10K bonus
Iscriviti gratis

Elaborare la tua richiesta...

Lascia una prestampa arXiv, pulisci il testo aromatizzato a LaTeX con ogni equazione resa in linea. Layout multi-colonna gestiti, riferimenti mantenuti intatti. Free, IA-powered.

Come usare estrattore PDF arXiv

1
Inserisci il tuo input

Digitare testo, caricare un file, o descrivere ciò che si desidera. Nessun account necessario.

2
Fare clic su genera

Il nostro IA elabora la tua richiesta in pochi secondi utilizzando i migliori modelli open-source.

3
Scarica e condividi

Scaricare, copiare o condividere il risultato. Gratis per uso personale e commerciale.

Utilizzare questo strumento tramite API

Automatizza questo strumento dal tuo codice. Endpoint REST compatibile con OpenAI, auth Bearer-token, nessun SDK aggiuntivo richiesto. I costi Token corrispondono all'interfaccia web.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the estrattore PDF arXiv tool on: ..."}]}'

estrattore PDF arXiv — FAQ

Lasciare cadere una prestampa arXiv e l'intelligenza artificiale converte l'intera carta in un testo pulito e aromato LaTeX. Le equazioni ritornano come un LaTeX corretto, i layout multi-colonna slacciati, i riferimenti intatti. Costruito su Meta Nougat, addestrato specificamente su milioni di pagine arXiv.

Il corpus di addestramento di Nougat è stato prestampato da arXiv in modo da brillare assolutamente sulla famiglia di layout IEEE / ACM / Neurips / ICML / arXiv. Altri estrattori PDF soffocano sulla matematica multi-colonna; questo è stato progettato per esso.

Scaricare il PDF da arXiv (ad esempio arxiv.org/pdf/2401.12345), caricarlo qui, recuperare un singolo file.txt con la carta completa come testo aromato LaTeX. Nessuna chiave API arXiv necessario; abbiamo solo bisogno del PDF.

Sì, questa è la caratteristica principale. La matematica in linea è...$, la matematica visualizzata...$$$... Anche le equazioni raster-rendered in vecchi documenti vengono attraverso correttamente perché il modello tratta ogni pagina come un'immagine.

Auto-handled. Due colonne IEEE-style è il layout arXiv più comune e Nougat lo distende in ordine di lettura corretto senza una bandiera di configurazione.

Sì, i marcatori in linea di siliconi[[Smith2020] rimangono al loro posto e l'elenco completo di riferimento alla fine viene estratto intatto per l'uso a valle di BibTeX/Zotero.

~8-15 sec/page. Un documento di conferenza di 12 pagine richiede ~2-3 min. Neurips-style 30+ pagine con appendici: 8-12 min. Inviare e andare via.

300 gettoni / pagina, piano 600. La maggior parte delle carte conferenze arXiv (8-15 pagine) sono 2.400-4.500 gettoni. Piscina gratuita quotidiana copre ~1-2 carte al giorno per gli utenti registrati; piani a pagamento ottenere illimitato.

Dare a ChatGPT / Claude per "spiegare questa carta," costruire RAG personali sui tuoi documenti salvati, cercare la tua lista di lettura, copiare equazioni nel tuo progetto LaTeX, o leggere il documento come testo semplice sul telefono.

Sì Nougat OCRs internamente. arXiv è stato LaTeX-rendered per 25+ anni in modo che la maggior parte delle preprinte sono digitali pulite. carte più vecchie scansionate funzionano ma la fedeltà matematica scende leggermente; riscatti a 300+ DPI per i migliori risultati.

PDF cancellati subito dopo l'estrazione. L'uscita LaTeX viene mantenuta 24h (anonymous) / 7 giorni (paid share link). Mai usato per l'addestramento. i PDF arXiv sono comunque CC-BY pubblici, ma non li memorizziamo in nessun modo.

Sì, sì. POST multipart File da /v1/document/accademic-pdf/. Risposta di JSON con Text_url..., Pagine da 10K gettoni gratuiti/mese. /api/ per esempio arricciatura.

Iscriviti gratis per 30.000 gettoni

Crea account libero

Nessuna carta di credito richiesta

Come valuteresti questo strumento?

Love this tool? Share it!