PDF į žymėjimą PDF ištraukiklis PDF į tekstą Mokslinis dokumentas iki teksto arXiv PDF ekstraktorius Daugiau →

Akademinis popieriaus ištraukėjas

Naudojimas komerciniais tikslais 380+ modeliai Nėra vandens ženklo Nėra reikalo pasirašyti

Numeskite arXiv spausdinimą, žurnalo popierių ar tezės skyrių – AI konvertuoja jį į švarų LaTeX aromatinį tekstą. Matematinės lygtys lieka lygtys, daugiakolonėlės išdėstymai gauti nelygumų, citatos išsaugotos. Powered by Meta Nugat-base.

Ištraukite tekstą + lygtis iš arXiv dokumentų, žurnalų ir temų. Matematinės lygtys konvertuojamos į LaTeX, daugiakolonėlės išdėstymai yra nenuvalyti, citatos yra išsaugotos. Powered by Meta Nugat. Free, no listup.

Kaip vartoti Akademinis popieriaus ištraukėjas

Įveskite įvedinį

Įveskite tekstą, įkelkite failą arba apibūdinkite ką norite. Sąskaitos nereikia.

Spustelėkite generavimą

Mūsų AI apdoroja Jūsų užklausą per kelias sekundes, naudodami geriausius atviro kodo modelius.

Atsisiųsti ir dalintis

Atsisiųskite, nukopijuokite arba pasidalinkite savo rezultatais. Nemokamas asmeniniam ir komerciniam naudojimui.

Naudoti šį įrankį per API

Automatizuoti šį įrankį iš savo kodo. OpenAI suderinama REST vertinamoji baigtis, Beaker-token auth, papildomų SDK nereikia. Token išlaidos atitinka interneto sąsają.

API dokumentacija Gauti API raktą

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Akademinis popieriaus ištraukėjas tool on: ..."}]}'

Susiję nemokamai AI įrankiai

PDF į žymėjimą

PDF ištraukiklis

PDF į tekstą

Mokslinis dokumentas iki teksto

arXiv PDF ekstraktorius

Akademinis popieriaus ištraukėjas — FAQ

Drop in bet akademinis / mokslinis popierius PDF — arXiv preprint, konferencijos popierius, žurnalo straipsnis, tezės skyrius — ir AIS konvertuoja jį į švarų LaTeX-Created tekstą. Matematinės lygtys pereina, kaip tinkama LaTeX, daugiakolonėlių išdėstymai yra įdėtas į skaitymo tvarką, ir citacijos + informaciniai sąrašai yra saugomi. Sukurtos specialiai tam, kad tankus mokslinių dokumentų pdftoteksto mangles.

Meta Nougat-base - vizija-enkoder-dekoder modelis apmokytas milijonais arXiv puslapių. Jis traktuoja kiekvieną PDF puslapį kaip paveikslėlį ir išvedimus struktūrizuotą Marcdown + LaTeX, todėl lygtys ateina per teisingai, net kai jie yra išversti kaip rastro glypsas šaltinyje PDF.

Docling įrankis (PDF į Markdown) naudoja IBM Granite-Docling - greitas, maketas-programa, optimizuota bendrųjų verslo dokumentus, pavyzdžiui, sutartis, ataskaitas, vadovus. Nougat yra lėtesnis, bet FAR geriau apie akademinius dokumentus, nes jis buvo specialiai apmokytas matematikos + kelių stulpelių mokslinius maketus. Naudokite Docling verslo docs, Nugat mokslinių tyrimų.

Taip — tai žudiko funkcija. Itin matematika grįžta kaip `$...$', rodomos lygtys kaip `$$...$'. Ji gali skaityti tiek LaTeX-referended lygtis iš arXiv pateikimo ir rastro lygtys nuskaityti iš senesnių laikraščių. Kokybė yra publikavimo laipsnio didžioji dauguma dokumentų.

Taip — Nougat nuvynioja dviejų stulpelių / trijų stulpelių išdėstymus į tinkamą skaitymo tvarką automatiškai. Joks tekstas šokinėja tarp stulpelių. Išnašos yra ekstrahuojamos į išnašų blokus kiekvieno skyriaus pabaigoje.

Tapatybės žymekliai `[12]' / `(Smith 2020)' likti viduje. Galų gale nuorodų sąrašai ateina per išsaugotus formatavimo nepažeistus, todėl jūs galite sujungti išvestį į Zotero / Mendeley / pasirinktinę citaciją.

Apie 8-15 sekundžių per puslapį mūsų H200. Tipiškas 10 puslapių konferencijos dokumentas veikia ~2 minučių. Ilgų tyrimų dokumentai (50+ puslapių) užtruks 8-12 minučių — pateikti ir vaikščioti.

300 žetonų viename puslapyje (aukštas 600). A 10 puslapių konferencijos popierius = 3000 žetonų. 30 puslapių tezės skyrius = 9000 žetonų. Kasdien nemokamas baseinas apima dauguma atsitiktinių mokslinių tyrimų skaitymas.

Įjunkite jį į ChatGPT/Claude popieriaus sumationation, sukurkite asmeninę RAG virš popieriaus corpus, semantiškai ieškokite savo bibliotekos, nukopijuokite lygtis tiesiai į LaTeX projektus, arba tiesiog skaitykite popieriaus paprastą tekstą telefone.

Taip — Nugat daro savo OCR žingsnis. Born-digital arXiv duomenys yra geriausias (švarus lygties atvaizdavimas); nuskenuoti senesni dokumentai veikia taip pat, bet matematinis patikimumas mažėja šiek tiek. Dėl geriausių matematikos rezultatų skenuojant, rescan at 300+ DPI prieš įkelkite.

Apdorota iš karto, LaTeX teksto išvestis yra išsaugota (24h anoniminė / 7d apmokėta akcijų nuoroda galiojimo pabaiga), šaltinis PDF yra ištrintas iš karto po ištraukimo. Niekada nenaudojamas mokymui. /privacy/ pilnai politikai.

Taip — Padėkite daugiadalį ` į /v1/ document/academic-pdf/. Grąžinkite {tekstas_url, puslapiai, peržiūra, žetonai, share_url}. Bealer auth (sk-free-...) suteikia 10K nemokamus žetonus/mėnesį. /api/ turi garbanos pavyzdį.

Užsiregistruoti nemokamai 30,000 žetonų

Sukurti nemokamą paskyrą

Kredito kortelės nereikia

Kaip vertinate šį įrankį?

Akademinis popieriaus ištraukėjas

Rezultatas

Kaip vartoti Akademinis popieriaus ištraukėjas

Įveskite įvedinį

Spustelėkite generavimą

Atsisiųsti ir dalintis

Naudoti šį įrankį per API

Susiję nemokamai AI įrankiai

Akademinis popieriaus ištraukėjas — FAQ

Kokia tai priemonė?

Kuris modelis suteikia jai galių?

Kaip tai skiriasi nuo reguliariai PDF į Markdown įrankis?

Ar ji tvarko matematikos lygtis?

Daugelio stulpelių išdėstymai?

O ką galima pasakyti apie citatas ir nuorodas?

Kaip greitai?

Kiek tai kainuoja?

Ką galiu padaryti su išvestimi?

Ar nuskaitomi dokumentai palaikomi?

Ar įkeliami PDF įrašai saugomi?

Ar yra API?

Gauti 10 000 nemokamai žetonai

Palaukite — gaukite 10K nemokamus žetonus!

Nori daugiau?