Extractor de hârtie academică

Utilizare comercială OK 380+ modele Fără semn de apă Nu este nevoie de înscriere
Model:
+ GPT-5, Claude, Gemini
Aruncați o pretipărire arXiv, ziarul, sau capitolul tezei — IA-l transformă în text curat cu gust LaTeX. Ecuațiile matematice rămân ca ecuații, planurile multi-columna devin neschimbate, citații conservate. Powered by Meta Nougat-base.

Aruncă o hârtie de cercetare PDF aici sau click pentru a încărca

PDF până la 50 MB. ~300 tokens pe pagină (math-aware).

Ecuații de citire + coloane dezboaie... ~10 sec/page
Opțiuni avansate
Rezultatul
Tokens scade. Obține mai multe tokens
Vrei rezultate mai bune? Modele premium (GPT-5, Claude, Gemini) oferă o calitate mai mare. Vizualizare planuri

❤️ Love this tool? Share it!

Inscrie-te pentru a obține o legătură de referință și câștiga 25.000 de jetoni pe prieten.

Vrei mai mult? Inregistreaza-te gratis pentru 30K tokens/zi + 10K bonus
Inscrie-te gratis

Prelucrarea cererii...

Trage text + ecuații din hârtiile, jurnalele și tezele de arXiv. Ecuațiile matematice sunt convertite în LaTeX, planuri multi-columna sunt dezvoltate, citații sunt păstrate. Alimentate de Meta Nougat. Gratuit, nu înscriere.

Cum să utilizaţi Extractor de hârtie academică

1
Introduceți intrarea

Tastați text, încărcați un fișier sau descrieți ce doriți. Nu este nevoie de cont.

2
Click generare

IA noastra proceseaza cererea ta in secunde folosind cele mai bune modele de open-source.

3
Descărcați & împărțiți

Descărcaţi, copiaţi sau împărtăşiţi rezultatul. Gratuit pentru utilizare personală şi comercială.

Folosește acest instrument prin API

Automatizați acest instrument din propriul cod. Endpoint REST-compatibil cu OpenAI, Bearer-token auth, nu este necesar SDK suplimentar. Costurile token corespunde interfață web.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Extractor de hârtie academică tool on: ..."}]}'

Extractor de hârtie academică — FAQ

Aruncați în orice document academic / de cercetare PDF — pretipărire arXiv, hârtie de conferință, articol de ziar, capitolul tezei – și IA o transformă în text curat format LaTeX. Ecuațiile matematice vin ca la un layout LaTeX corespunzător, multi-columne sunt desfășurate în ordine de lectură, și citații + liste de referință sunt păstrate. Construite în special pentru tipul de documente științifice dense pdftotext mangles.

Meta's Nougat-base — un model vizual-encoder-decoder instruit pe milioane de pagini arXiv. Tratează fiecare pagină PDF ca o imagine și ieșiri structurate Markdown + LaTeX, motiv pentru care ecuațiile vin prin corect, chiar și atunci când sunt prezentate ca glife raster în PDF sursă.

Instrumentul Docling (PDF to Markdown) folosește IBM Granite-Docling – rapid, layout-aware, optimizat pentru documentele generale de afaceri cum ar fi contracte, rapoarte, manuale. Nougat este mai lent, dar FAR mai bine pe documente academice pentru că a fost antrenat în special pe layouturi științifice matematice + multi-columna. Folosește Docling pentru documente de afaceri, Nougat pentru cercetare.

Da, aceasta este caracteristica criminalului. Matematica inline se întoarce ca `$...$`, ecuații afișate ca `$...$`. Acesta poate citi ambele ecuații LaTeX-rendered de la sume arXiv și ecuații raster scanate din hârtii mai vechi. Calitatea este de grad publicare pentru marea majoritate de hârtii.

Da — Nougat dezlănțuiește două coloane / trei coloane în ordinea de lectură adecvată automat. Nu mai există text săritor la mijlocul sentenței între coloane. Note de subsol sunt extrase în blocuri de note de subsol la sfârșitul fiecărei secțiuni.

Marcatorii de citare `[12]` / `(Smith 2020)` stau inline. Lista de referință la sfârșit vin prin conservat cu formatare intact, astfel încât să puteți canaliza ieșirea în Zotero / Mendeley / un analizator de citare personalizat.

Aproximativ 8-15 secunde pe pagina de pe H200. O hârtie de conferință tip 10 pagini se desfășoară în ~2 minute. Jurnaluri de sondaj lung (50+ pagini) ia 8-12 minute — trimite și pleacă.

300 de jetonuri pe pagină (etajul 600). O hârtie de conferință de 10 pagini = 3.000 jetonuri. Un capitol de teză de 30 de pagini = 9.000 jetonuri. Piscină gratuită zilnic acoperă cele mai informale cercetări.

Pune-l în ChatGPT/Claude pentru sumarizare de hârtie, construiește un RAG personal peste un corpus de hârtii, semantic-search propria bibliotecă, copia ecuații direct în proiecte LaTeX, sau doar citiți hârtia ca text simplu pe telefon.

Da — Nougat face propriul său pas OCR. Suplimentele de arXiv naștere-digital sunt cele mai bune (curate ecuație rendering); documente mai vechi scanate lucrează prea, dar fidelitatea matematică scade un pic. Pentru cele mai bune rezultate matematice pe scanări, reescand la 300+ DPI înainte de încărcare.

Procesată imediat, ieșirea textului LaTeX este păstrată (24h anonimă / 7d plăți de expirare a acționării), sursa PDF este eliminată imediat după extracție. Niciodată folosită pentru formare. /privacy/ pentru întreaga politică.

Da — POST a multipart `file` to /v1/document/academic-pdf /. Returnează {text_url, pagini, previzualizare, tokens, share_url}. Bear auth (sk-free-...) oferă 10K jets gratuit/luna. /api/ are exemplu curl.

Inscrie-te gratis pentru 10.000 de jetoni

Creează cont liber

Nu sunt necesare carduri de credit

Cum ai evalua acest instrument?

Love this tool? Share it!