Akademický extraktor papíru

Komerční využití OK 380+ modely Žádné vodoznaky. Není třeba se zaregistrovat
Vzor:
+ GPT-5, Claude, Gemini
Drop arXiv preprint, magazínový papír, nebo kniha práce kapitola UI přemění na čistý LaTeX-lavored text. Math rovnice zůstávají jako rovnice, multi-sloupce rozložení dostat odwound, citace zachována. Powered Meta Nougat-base.

Drop výzkumný dokument PDF zde nebo klikněte na nahrát

PDF až 50 MB. ~300 žetonů na stránku (math-aware).

Čtení rovnic + odvíjení sloupců... ~10 sec/page
Pokročilé možnosti
Výsledek
Tokeny docházejí. Získejte více žetonů
Chceš lepší výsledky? Premium modely (GPT-5, Claude, Gemini) poskytovat vyšší kvalitu. Zobrazit plány

Zpracovávám vaši žádost...

Vytáhněte text + rovnice z arXiv papíry, časopisy, a práce. Matematika rovnice jsou převedeny na LaTeX, multi-sloupce rozložení jsou odvlněné, citace jsou zachovány. Powered Meta Nougat. Volný, žádný zápis.

Jak se používá Akademický extraktor papíru

1
Zadejte svůj vstup

Zadejte text, nahrajte soubor nebo popište, co chcete. Žádný účet nepotřebujete.

2
Klikněte na generovat

Naše UI zpracovává váš požadavek během několika sekund pomocí nejlepších open-source modelů.

3
Stáhnout & podíl

Stáhnout, zkopírovat nebo sdílet svůj výsledek. Volný pro osobní a komerční použití.

Použijte tento nástroj přes API

Automatizovat tento nástroj z vašeho vlastního kódu. OpenAI kompatibilní REST koncového bodu, Bearer-token auth, není potřeba žádný SDK navíc. Token náklady odpovídají webové rozhraní.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Akademický extraktor papíru tool on: ..."}]}'

Akademický extraktor papíru — FAQ

Drop v každém akademickém / výzkumném dokumentu PDF? arXiv preprint, konferenční papír, časopis článek, práce kapitola a UI přemění na čistý LaTeX-formatovaný text. Math rovnice přijít jako správné LaTeX, multi-sloupce rozvržení jsou odvíjeny do pořadí čtení, a citace + referenční seznamy jsou zachovány. Zastavěny speciálně pro druh husté vědecké dokumenty pdftotext mangles.

Meta Nougat-base (Nougat-base) model vize-enkodér-dekodér vyškolený na milionech arXiv stránek. Bere každou stránku PDF jako obrázek a výstupy strukturované Markdown + LaTeX, což je důvod, proč rovnice přicházejí správně, i když jsou přeloženy jako rastrové glyfy ve zdrojovém PDF.

Doclingový nástroj (PDF to Markdown) používá IBM Granite-Docling rychlé, rozvržení-ware, optimalizované pro obecné obchodní dokumenty, jako jsou smlouvy, zprávy, příručky. Nugat je pomalejší, ale FAR lepší na akademické papíry, protože to bylo specificky vyškoleno na matematiku + více-sloupce vědecké rozvržení. Použijte Docling pro obchodní dokumenty, Nougat pro výzkum.

Ano, to je zabijácké funkce. Inline matematika se vrací jako...$$, zobrazené rovnice jako...$$$$$. Může číst obě LaTeX-rendered rovnice z arXiv podání a rastrové rovnice scanned ze starších dokumentů. Kvalita je publikace-grade pro drtivou většinu dokumentů.

Ano Nougat odvíjí dvou-sloupce / tří-sloupce rozvržení do správného pořadí čtení automaticky. Žádné další text skákání střední-sentence mezi sloupcemi. Poznámka pod čarou jsou extrahovány do bloků poznámky pod čarou na konci každého oddílu.

Citační markery?[12]? /??

O 8-15 sekund na stránce na naší H200. Typický 10stránkový konferenční papír běží za ~2 minuty. Dlouhý průzkum papíry (50+ stránky) trvat 8-12 minut?? Předložte a odejít.

300 žetonů na stránku (podlaha 600). 10stránkový konferenční papír = 3 000 žetonů. 30stránková kapitola práce = 9 000 žetonů. Denně volný bazén pokrývá většinu příležitostného čtení výzkumu.

Potrubí do ChatGPT/Claude pro summarizaci papíru, postavte osobní RAG přes korpus papíru, sémantické-hledat vlastní knihovnu, kopírovat rovnice přímo do projektů LaTeX, nebo jen číst papír jako prostý text na telefonu.

Ano Nougat dělá svůj vlastní OCR krok. Born-digitální arXiv podání jsou nejlepší (čistá rovnice vykreslování); skenované starší papíry fungují příliš, ale matematika věrnost klesá trochu. Pro nejlepší výsledky matematiky na skeny, reskenovat na 300+ DPI před odesláním.

Okamžitě zpracujeme textový výstup LaTeX (24h anonymní / 7d placená doba platnosti share-link), zdroj PDF se vymaže hned po extrakci. Nikdy se nepoužívá pro výcvik. /privacy/ pro plnou politiku.

Ano, POST a multipart, share_url}. Bearer auth (sk-free-...) dává 10K zdarma žetony/měsíc. /api/ má curling příklad.

Zaregistrujte se zdarma pro 30 000 žetonů

Vytvořit volný účet

Kreditní karta není nutná

Jak byste ohodnotili tento nástroj?

Love this tool? Share it!