PDF a Markdown Estrattore PDF PDF a testo Documento di ricerca al testo estrattore PDF arXiv Di più →

Academic Paper Extractor

Uso commerciale OK 380+ modelli Nessuna filigrana Nessuna registrazione necessaria

Lasciare un arXiv preprint, carta di giornale, o il capitolo di tesi IA converte in pulito LaTeX-saporato testo. Equazioni matematiche rimanere come equazioni, multi-colonne layout ottenere non capovolto, citazioni conservate. Powered by Meta Nougat-base.

Tirare il testo + le equazioni da carte, riviste e tesi arXiv. Le equazioni matematiche vengono convertite in LaTeX, i layout multi-colonne sono errati, le citazioni sono conservate. Powered by Meta Nougat. Free, no signup.

Come usare Academic Paper Extractor

Inserisci il tuo input

Digitare testo, caricare un file, o descrivere ciò che si desidera. Nessun account necessario.

Fare clic su genera

Il nostro IA elabora la tua richiesta in pochi secondi utilizzando i migliori modelli open-source.

Scarica e condividi

Scaricare, copiare o condividere il risultato. Gratis per uso personale e commerciale.

Utilizzare questo strumento tramite API

Automatizza questo strumento dal tuo codice. Endpoint REST compatibile con OpenAI, auth Bearer-token, nessun SDK aggiuntivo richiesto. I costi Token corrispondono all'interfaccia web.

Documentazione API Ottieni la chiave API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Academic Paper Extractor tool on: ..."}]}'

Strumenti IA gratuiti correlati

PDF a Markdown

Estrattore PDF

PDF a testo

Documento di ricerca al testo

estrattore PDF arXiv

Academic Paper Extractor — FAQ

Drop in qualsiasi documento accademico / di ricerca PDF ArXiv preprint, conferenza paper, articolo di giornale, tesi capitolo e IA converte in pulito LaTeX-formattato testo. Equazioni matematiche vengono attraverso come proprio LaTeX, layout multi-colonna sono swound in ordine di lettura, e citazioni + liste di riferimento sono conservati. Costruito specificamente per il tipo di denso documenti scientifici pdftotext mangles.

Il modello Nougat-base di Meta è un modello di vision-encoder-decoder addestrato su milioni di pagine arXiv. Tratta ogni pagina PDF come un'immagine e uscite strutturate Markdown + LaTeX, motivo per cui le equazioni passano correttamente anche quando vengono rese come glifi raster nel PDF sorgente.

Academic Paper Extractor Docling (PDF a Markdown) utilizza IBM Granito-Docling Hoppenstedt veloce, layout-aware, ottimizzato per documenti aziendali generali come contratti, report, manuali. Nougat è più lento ma FAR meglio su documenti accademici perché è stato specificamente addestrato sulla matematica + multi-colonna layout scientifici. Utilizza Docling per documenti aziendali, Nougat per la ricerca.

Sì, questa è la caratteristica killer. La matematica in linea torna come...$, le equazioni visualizzate come...$$ $... $ $. Può leggere entrambe le equazioni rese LaTeX dalle presentazioni di arXiv e le equazioni raster scansionate dai vecchi documenti. La qualità è pubblicazione-grado per la stragrande maggioranza dei documenti.

Sì Nougat si distende automaticamente nei layout a due colonne / tre colonne in un ordine di lettura corretto. Basta saltare il testo a metà fra le colonne. Le note a piè di pagina sono estratte in blocchi a nota alla fine di ogni sezione.

Marcatori di citazione[12][12] [49] / [49](Smith 2020) [49] rimanere in linea. Gli elenchi di riferimento alla fine vengono attraverso conservati con la formattazione intatta, in modo da poter convertire l'output in Zotero / Mendeley / un parser di citazione personalizzato.

Circa 8-15 secondi per pagina sul nostro H200. Una tipica carta conferenza di 10 pagine funziona in ~2 minuti. Documenti di indagine lunghi (50+ pagine) richiedono 8-12 minuti

300 gettoni per pagina (piano 600). Una carta conferenza di 10 pagine = 3.000 gettoni. Un capitolo di tesi di 30 pagine = 9.000 gettoni. La piscina gratuita quotidiana copre la maggior parte casuale ricerca-lettura.

Connetterlo in ChatGPT/Claude per la sintesi della carta, costruire un RAG personale su un corpus di carte, cercare semantica la propria libreria, copiare equazioni direttamente nei progetti LaTeX, o semplicemente leggere il documento come testo semplice sul telefono.

Sì Nougat fa il suo passo OCR. I contributi arXiv born-digital sono migliori (rendering di equazione pulita); le carte vecchie scansionate funzionano anche ma la fedeltà matematica scende un po '. Per i migliori risultati di matematica sulle scansioni, riscatti a 300+ DPI prima di caricare.

processato immediatamente, l'output del testo LaTeX viene mantenuto (24h anonimo / 7d pagato share-link scadenza), la fonte PDF viene eliminato subito dopo l'estrazione. Mai utilizzato per la formazione. /privacy / per la politica completa.

Sì POST {text_url, pages, preview, tokens, share_url}. Bearer auth (sk-free-...) restituisce {text_url, pages, preview, tokens, share_url}. Bearer auth (sk-free-...) fornisce 10K tokens gratuiti/mese. /api/ ha l'esempio arricciatura.

Iscriviti gratis per 30.000 gettoni

Crea account libero

Nessuna carta di credito richiesta

Come valuteresti questo strumento?

Academic Paper Extractor

Risultato

Come usare Academic Paper Extractor

Inserisci il tuo input

Fare clic su genera

Scarica e condividi

Utilizzare questo strumento tramite API

Strumenti IA gratuiti correlati

Academic Paper Extractor — FAQ

Cos'è Academic Paper Extractor?

Quale modello lo alimenta?

In che modo questo è diverso dal normale strumento PDF to Markdown?

Gestisce le equazioni matematiche?

Layout a più colonne?

E le citazioni e le referenze?

Quanto e' veloce?

Quanto costa?

Cosa posso fare con l'output?

Sono supportati i documenti scansionati?

Sono memorizzati PDF caricati?

C'e' un'API?

Ottieni 10.000 Token gratuiti

Aspetta. Ottieni 10K Token gratis!

Ne vuoi ancora?