PDF kuni Markdown PDF ekstraktor PDF kuni tekst Uurimisdokument tekstina ArXiv PDF ekstraktor Rohkem →

Akadeemiline paberiekstraktor

Kaubanduslik kasutamine OK 380+ mudelid Veemärk puudub Registreerimine ei ole vajalik

Viska arXiv preprint, ajakirja paber, või väitekirja peatükk ~ AI muudab selle puhtaks LaTeX-maitseline tekst. Matemaatika võrrandid jäävad võrrandid, mitme veeru paigutused saada lahti, tsitaadid säilinud. Powered by Meta Nougat-base.

Tõmba teksti + võrrandid välja arXiv paberid, ajakirjad, ja needid. Matemaatika võrrandid on teisendatud LaTeX, mitme veeru paigutused on unwound, tsitaadid on säilinud. Powered poolt Meta Nougat. Tasuta, mingit märkimist.

Kuidas kasutada Akadeemiline paberiekstraktor

Sisesta oma sisend

Kirjuta tekst, laadi fail üles või kirjelda, mida soovid. Kontot pole vaja.

Klõpsa genereerimiseks

Meie tehisintellekt töötleb teie soovi sekunditega, kasutades parimaid avatud lähtekoodiga mudeleid.

Allalaadimine ja jagamine

Lae alla, kopeeri või jaga oma tulemust. Tasuta isiklikuks ja kaubanduslikuks kasutamiseks.

Selle tööriista kasutamine API kaudu

Automaatne see tööriist oma koodi. OpenAI-ühilduv REST tulemusnäitaja, Bearer-token author, ei ole extra SDK vaja. Token kulud sobivad veebiliides.

API dokumentatsioon API võtme hankimine

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Akadeemiline paberiekstraktor tool on: ..."}]}'

Seotud tasuta AI tööriistad

PDF kuni Markdown

PDF ekstraktor

PDF kuni tekst

Uurimisdokument tekstina

ArXiv PDF ekstraktor

Akadeemiline paberiekstraktor — FAQ

Drop iga akadeemilise / teadustöö paber PDF ~ arXiv preprint, konverentsi paber, ajakirja artikkel, väitekirja peatükk ~ ja AI muudab selle puhas LaTeX vormindatud tekst. Matemaatika võrrandid tulevad läbi nagu õige LaTeX, mitme veeru paigutused on unwound arvesse lugemine järjekorras, ja tsitaadid + viited nimekirjad on säilinud. Ehitatud spetsiaalselt sellist tihedat teaduslikku dokumente pdftotext sangles.

Meta's Nougat-base ~ vision-encoder-decoder mudel koolitatud miljoneid arXiv lehekülge. See kohtleb iga PDF lehe pilt ja väljundid struktureeritud Markdown + LaTeX, mistõttu võrrandid tulevad läbi õigesti isegi siis, kui nad on tõlgitud raster glyphs allikas PDF.

Docling tööriist (PDF kuni Markdown) kasutab IBM Granite-Docling ~ kiire, paigutus-aware, optimeeritud üldiste äridokumentide nagu lepingud, aruanded, käsiraamatud. Nougat on aeglasem, kuid FAR parem akadeemilistel paberitel, sest see oli spetsiaalselt koolitatud matemaatika + mitme veeru teaduslik paigutus. Kasuta dokling äri docs, Nougat teadusuuringuteks.

Jah ~ see on tapja funktsioon. Inline matemaatika tuleb tagasi kui ~$...$~, kuvatud võrrandid kui ~$$$.$. ~ See võib lugeda nii LaTeX-revered võrrandid ArXiv esildised ja raster võrrandid skaneeritud vanemad paberid. Kvaliteet on avaldamise kvaliteedi järgi enamik pabereid.

Jah Nougat lõõgastab automaatselt kahe veeru / kolme veeru paigutused õigesse lugemisjärjekorda. Ei mingit teksti, mis hüppab keskelt veergude vahel. Märkused on eraldatud allmärkusplokkidesse iga sektsiooni lõpus.

Citation markerid ~[12] / ~(Smith 2020) ~ jääda inline. Viide nimekirjad lõpus tulevad läbi säilitada vormindamine puutumata, nii et saate toru väljund arvesse Zotero / Mendeley / custom tsitaat parser.

Umbes 8-15 sekundit lehe kohta meie H200. Tüüpiline 10-leheküljeline konverentsidokument töötab ~2 minutit. Pikad uuringupaberid (50+ lehekülge) võtab 8-12 minutit ~ esitada ja kõndida ära.

300 märgid lehe kohta (korter 600). 10-leheküljeline konverentsidokument = 3000 märgid. 30-leheküljeline väitekirja peatükk = 9000 märgid. Igapäevane tasuta bassein hõlmab kõige juhuslikum teadus-lugemine.

Ühenda see ChatGPT/Claude paberi liitmiseks, isikliku RAG-i ehitamiseks paberite korpuse kohale, semantiliseks otsinguks oma raamatukogus, võrrandite kopeerimiseks otse LaTeXi projektidesse või lihtsalt paberi lugemiseks tavalise tekstina telefonis.

Jah Nougat teeb oma OCR samm. Born-digital arXiv esildised on parimad (puhas võrrand renderdamine); skaneeritud vanemad paberid töö liiga, kuid matemaatika truudus langeb natuke. Parima matemaatika tulemusi skaneerib, rescan 300+ DPI enne üleslaadimist.

Kohe töödeldud, LaTeXi teksti väljund säilitatakse (24h anonüümne / 7d tasuline Share- link aegumise), allikas PDF kustutatakse kohe pärast väljavõtmist. Ei kasutata kunagi koolituseks. / Privaatsus / kogu poliitika.

Jah POST a multipart ~file' to /v1/document/academic-pdf /. Tagastab {text_url, leheküljed, eelvaatlus, märgid, share_url}. Bearer auth (sk-free-...) annab 10K tasuta märgid / kuu. / api / on curl näide.

Registreeru tasuta 30 000 märgi eest

Loo vaba konto

Krediitkaarti pole vaja

Kuidas sa hindaksid seda tööriista?

Akadeemiline paberiekstraktor

Tulemus

Kuidas kasutada Akadeemiline paberiekstraktor

Sisesta oma sisend

Klõpsa genereerimiseks

Allalaadimine ja jagamine

Selle tööriista kasutamine API kaudu

Seotud tasuta AI tööriistad

Akadeemiline paberiekstraktor — FAQ

Mis tööriist see on?

Milline mudel seda suudab?

Kuidas erineb see tavalisest PDF- i ja Markdowni tööriistast?

Kas see tegeleb matemaatiliste võrranditega?

Mitme veeru paigutused?

Kuidas on lood tsitaatide ja viidetega?

Kui kiire see on?

Kui palju see maksab?

Mida ma saan väljundiga teha?

Kas skaneeritud paberid on toetatud?

Kas üleslaaditud PDF- id salvestatakse?

Kas API on olemas?

Hangi 10 000 Tasuta Tokenit

Oodake, saage 10K Tasuta Tokenid!

Tahad veel?