PDF a Markdown Estrattore PDF PDF a testo Academic Paper Extractor Documento di ricerca al testo Di più →

estrattore PDF arXiv

Uso commerciale OK 380+ modelli Nessuna filigrana Nessuna registrazione necessaria

Lasciare un arXiv preprint, carta di giornale, o il capitolo di tesi IA converte in pulito LaTeX-saporato testo. Equazioni matematiche rimanere come equazioni, multi-colonne layout ottenere non capovolto, citazioni conservate. Powered by Meta Nougat-base.

Lascia una prestampa arXiv, pulisci il testo aromatizzato a LaTeX con ogni equazione resa in linea. Layout multi-colonna gestiti, riferimenti mantenuti intatti. Free, IA-powered.

Come usare estrattore PDF arXiv

Inserisci il tuo input

Digitare testo, caricare un file, o descrivere ciò che si desidera. Nessun account necessario.

Fare clic su genera

Il nostro IA elabora la tua richiesta in pochi secondi utilizzando i migliori modelli open-source.

Scarica e condividi

Scaricare, copiare o condividere il risultato. Gratis per uso personale e commerciale.

Utilizzare questo strumento tramite API

Automatizza questo strumento dal tuo codice. Endpoint REST compatibile con OpenAI, auth Bearer-token, nessun SDK aggiuntivo richiesto. I costi Token corrispondono all'interfaccia web.

Documentazione API Ottieni la chiave API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the estrattore PDF arXiv tool on: ..."}]}'

Strumenti IA gratuiti correlati

PDF a Markdown

Estrattore PDF

PDF a testo

Academic Paper Extractor

Documento di ricerca al testo

estrattore PDF arXiv — FAQ

Lasciare cadere una prestampa arXiv e l'intelligenza artificiale converte l'intera carta in un testo pulito e aromato LaTeX. Le equazioni ritornano come un LaTeX corretto, i layout multi-colonna slacciati, i riferimenti intatti. Costruito su Meta Nougat, addestrato specificamente su milioni di pagine arXiv.

Il corpus di addestramento di Nougat è stato prestampato da arXiv in modo da brillare assolutamente sulla famiglia di layout IEEE / ACM / Neurips / ICML / arXiv. Altri estrattori PDF soffocano sulla matematica multi-colonna; questo è stato progettato per esso.

Scaricare il PDF da arXiv (ad esempio arxiv.org/pdf/2401.12345), caricarlo qui, recuperare un singolo file.txt con la carta completa come testo aromato LaTeX. Nessuna chiave API arXiv necessario; abbiamo solo bisogno del PDF.

Sì, questa è la caratteristica principale. La matematica in linea è...$, la matematica visualizzata...$$$... Anche le equazioni raster-rendered in vecchi documenti vengono attraverso correttamente perché il modello tratta ogni pagina come un'immagine.

Auto-handled. Due colonne IEEE-style è il layout arXiv più comune e Nougat lo distende in ordine di lettura corretto senza una bandiera di configurazione.

Sì, i marcatori in linea di siliconi[[Smith2020] rimangono al loro posto e l'elenco completo di riferimento alla fine viene estratto intatto per l'uso a valle di BibTeX/Zotero.

~8-15 sec/page. Un documento di conferenza di 12 pagine richiede ~2-3 min. Neurips-style 30+ pagine con appendici: 8-12 min. Inviare e andare via.

300 gettoni / pagina, piano 600. La maggior parte delle carte conferenze arXiv (8-15 pagine) sono 2.400-4.500 gettoni. Piscina gratuita quotidiana copre ~1-2 carte al giorno per gli utenti registrati; piani a pagamento ottenere illimitato.

Dare a ChatGPT / Claude per "spiegare questa carta," costruire RAG personali sui tuoi documenti salvati, cercare la tua lista di lettura, copiare equazioni nel tuo progetto LaTeX, o leggere il documento come testo semplice sul telefono.

Sì Nougat OCRs internamente. arXiv è stato LaTeX-rendered per 25+ anni in modo che la maggior parte delle preprinte sono digitali pulite. carte più vecchie scansionate funzionano ma la fedeltà matematica scende leggermente; riscatti a 300+ DPI per i migliori risultati.

PDF cancellati subito dopo l'estrazione. L'uscita LaTeX viene mantenuta 24h (anonymous) / 7 giorni (paid share link). Mai usato per l'addestramento. i PDF arXiv sono comunque CC-BY pubblici, ma non li memorizziamo in nessun modo.

Sì, sì. POST multipart File da /v1/document/accademic-pdf/. Risposta di JSON con Text_url..., Pagine da 10K gettoni gratuiti/mese. /api/ per esempio arricciatura.

Iscriviti gratis per 30.000 gettoni

Crea account libero

Nessuna carta di credito richiesta

Come valuteresti questo strumento?

estrattore PDF arXiv

Risultato

Come usare estrattore PDF arXiv

Inserisci il tuo input

Fare clic su genera

Scarica e condividi

Utilizzare questo strumento tramite API

Strumenti IA gratuiti correlati

estrattore PDF arXiv — FAQ

Che cos'è l'estrattore PDF di arXiv?

Perche' arXiv in particolare?

Come lo uso?

Le equazioni sono arrivate?

Ordine di lettura a più colonne?

Citazioni conservate?

Velocita'?

Prezzi?

Cosa posso fare con l'output?

Sono supportati i PDF arXiv scansionati?

Privacy?

API?

Ottieni 10.000 Token gratuiti

Aspetta. Ottieni 10K Token gratis!

Ne vuoi ancora?