Academic Paper Extractor

Uso commerciale OK 380+ modelli Nessuna filigrana Nessuna registrazione necessaria
Modello:
+ GPT-5, Claude, Gemini
Lasciare un arXiv preprint, carta di giornale, o il capitolo di tesi IA converte in pulito LaTeX-saporato testo. Equazioni matematiche rimanere come equazioni, multi-colonne layout ottenere non capovolto, citazioni conservate. Powered by Meta Nougat-base.

Lasciare una carta di ricerca PDF qui o fare clic per caricare

PDF fino a 50 MB. ~300 gettoni per pagina (math-aware).

Equazioni di lettura + colonne di srotolamento... ~10 sec/page
Opzioni avanzate
Risultato
I token sono bassi. Ottenere più token
Vuoi risultati migliori? Modelli premium (GPT-5, Claude, Gemini) forniscono una qualità superiore. Visualizza Piani

❤️ Love this tool? Share it!

Registrati per ottenere un link di referral e guadagnare 25.000 gettoni per amico.

Ne vuoi ancora? Iscriviti gratis per 30K gettoni al giorno + 10K bonus
Iscriviti gratis

Elaborare la tua richiesta...

Tirare il testo + le equazioni da carte, riviste e tesi arXiv. Le equazioni matematiche vengono convertite in LaTeX, i layout multi-colonne sono errati, le citazioni sono conservate. Powered by Meta Nougat. Free, no signup.

Come usare Academic Paper Extractor

1
Inserisci il tuo input

Digitare testo, caricare un file, o descrivere ciò che si desidera. Nessun account necessario.

2
Fare clic su genera

Il nostro IA elabora la tua richiesta in pochi secondi utilizzando i migliori modelli open-source.

3
Scarica e condividi

Scaricare, copiare o condividere il risultato. Gratis per uso personale e commerciale.

Utilizzare questo strumento tramite API

Automatizza questo strumento dal tuo codice. Endpoint REST compatibile con OpenAI, auth Bearer-token, nessun SDK aggiuntivo richiesto. I costi Token corrispondono all'interfaccia web.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Academic Paper Extractor tool on: ..."}]}'

Academic Paper Extractor — FAQ

Drop in qualsiasi documento accademico / di ricerca PDF ArXiv preprint, conferenza paper, articolo di giornale, tesi capitolo e IA converte in pulito LaTeX-formattato testo. Equazioni matematiche vengono attraverso come proprio LaTeX, layout multi-colonna sono swound in ordine di lettura, e citazioni + liste di riferimento sono conservati. Costruito specificamente per il tipo di denso documenti scientifici pdftotext mangles.

Il modello Nougat-base di Meta è un modello di vision-encoder-decoder addestrato su milioni di pagine arXiv. Tratta ogni pagina PDF come un'immagine e uscite strutturate Markdown + LaTeX, motivo per cui le equazioni passano correttamente anche quando vengono rese come glifi raster nel PDF sorgente.

Academic Paper Extractor Docling (PDF a Markdown) utilizza IBM Granito-Docling Hoppenstedt veloce, layout-aware, ottimizzato per documenti aziendali generali come contratti, report, manuali. Nougat è più lento ma FAR meglio su documenti accademici perché è stato specificamente addestrato sulla matematica + multi-colonna layout scientifici. Utilizza Docling per documenti aziendali, Nougat per la ricerca.

Sì, questa è la caratteristica killer. La matematica in linea torna come...$, le equazioni visualizzate come...$$ $... $ $. Può leggere entrambe le equazioni rese LaTeX dalle presentazioni di arXiv e le equazioni raster scansionate dai vecchi documenti. La qualità è pubblicazione-grado per la stragrande maggioranza dei documenti.

Sì Nougat si distende automaticamente nei layout a due colonne / tre colonne in un ordine di lettura corretto. Basta saltare il testo a metà fra le colonne. Le note a piè di pagina sono estratte in blocchi a nota alla fine di ogni sezione.

Marcatori di citazione[12][12] [49] / [49](Smith 2020) [49] rimanere in linea. Gli elenchi di riferimento alla fine vengono attraverso conservati con la formattazione intatta, in modo da poter convertire l'output in Zotero / Mendeley / un parser di citazione personalizzato.

Circa 8-15 secondi per pagina sul nostro H200. Una tipica carta conferenza di 10 pagine funziona in ~2 minuti. Documenti di indagine lunghi (50+ pagine) richiedono 8-12 minuti

300 gettoni per pagina (piano 600). Una carta conferenza di 10 pagine = 3.000 gettoni. Un capitolo di tesi di 30 pagine = 9.000 gettoni. La piscina gratuita quotidiana copre la maggior parte casuale ricerca-lettura.

Connetterlo in ChatGPT/Claude per la sintesi della carta, costruire un RAG personale su un corpus di carte, cercare semantica la propria libreria, copiare equazioni direttamente nei progetti LaTeX, o semplicemente leggere il documento come testo semplice sul telefono.

Sì Nougat fa il suo passo OCR. I contributi arXiv born-digital sono migliori (rendering di equazione pulita); le carte vecchie scansionate funzionano anche ma la fedeltà matematica scende un po '. Per i migliori risultati di matematica sulle scansioni, riscatti a 300+ DPI prima di caricare.

processato immediatamente, l'output del testo LaTeX viene mantenuto (24h anonimo / 7d pagato share-link scadenza), la fonte PDF viene eliminato subito dopo l'estrazione. Mai utilizzato per la formazione. /privacy / per la politica completa.

Sì POST {text_url, pages, preview, tokens, share_url}. Bearer auth (sk-free-...) restituisce {text_url, pages, preview, tokens, share_url}. Bearer auth (sk-free-...) fornisce 10K tokens gratuiti/mese. /api/ ha l'esempio arricciatura.

Iscriviti gratis per 30.000 gettoni

Crea account libero

Nessuna carta di credito richiesta

Come valuteresti questo strumento?

Love this tool? Share it!