ArXiv ekstraktor PDF

Wykorzystanie handlowe OK Modele 380+ Brak znaku wodnego Nie ma potrzeby rejestracji
Wzór:
+ GPT-5, Claude, Gemini
Wyrzuć arXiv preprint, dziennik papieru, lub rozdział tezy – SI konwertuje go na czysty tekst z LaTeX zapamiętany. Matematyczne równania pozostają jako równania, wielokolumnowe układy są niezranione, cytaty zachowane. Powered by Meta Nougat-base.

Przesuń tutaj papier badawczy PDF lub kliknij, aby wysłać

PDF do 50 MB. ~300 żetonów na stronę (matematyka).

Czytanie równań + rozwijanie kolumn... ~10 sec/page
Zaawansowane opcje
Wynik
Tokiny się skończyły. Zdobądź więcej tokenów
Chcesz lepsze wyniki? Modele premium (GPT-5, Claude, Gemini) dostarcza wyższej jakości. Widok planów

❤️ Love this tool? Share it!

Zaloguj się aby uzyskać link referencyjny i zarobić 25 000 żetonów na przyjaciela.

Chcesz więcej? Zarejestruj się za darmo za 30K tokeny/dzień + 10K bonus
Zarejestruj się za darmo

Przetwarzam twoją prośbę...

Przesuń arXiv wstępny print, uzyskuj czysty tekst z LaTeX, z każdym równaniem wyświetlonym w kolejce. Wielokolumnowe układy obsługiwane, referencje utrzymywane nienaruszone. Wolne, SI napędowe.

Jak stosować lek ArXiv ekstraktor PDF

1
Wprowadź swoje wpisy

Wpisz tekst, wyślij plik lub opisz, czego chcesz. Nie jest potrzebne konto.

2
Kliknij wygenerować

Nasz SI przetwarza Twoją prośbę w sekundach przy użyciu najlepszych modeli open-source.

3
Pobierz & dzielenie

Pobierz, kopiuj lub podziel się swoim wynikiem. Darmowe do użytku osobistego i komercyjnego.

Użyj tego narzędzia przez API

Automatyzuj to narzędzie z własnego kodu. Kompatybilny z OpenAI REST punkt końcowy, Authentic-Bearer-token, nie jest wymagany dodatkowy SDK. Koszty token pasują do interfejsu internetowego.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the ArXiv ekstraktor PDF tool on: ..."}]}'

ArXiv ekstraktor PDF — FAQ

Wprowadź w arXiv preprint i SI przekonwertuje cały papier na czysty tekst z LaTeX. Równoważenia wracają jako odpowiednie LaTeX, wielokolumnowe układy niezranione, odnośniki nienaruszone. Wbudowany na Meta Nougat, przeszkolony specjalnie na milionach stron arXiv.

Korpus treningowy Nougata był przedprintem arXiv – więc absolutnie świeci na IEEE / ACM / NeuriPS / ICML / arXiv layout family. Pozostałe ekstraktory PDF uduszają się wielokolumnową matematyką; ten został zaprojektowany do tego.

Pobierz PDF z arXiv (np. arxiv.org/pdf/2401.12345), wyślij go tutaj, odbierz plik.txt z pełnym papierem jako tekst z zapłodnieniem LaTeX. Brak klucza arXiv API potrzebny; potrzebujemy tylko PDF.

Tak — to jest funkcja tytułu. Matematyka Inline to `$...$', wyświetlona matematyka `$...$'. Nawet równania z rastromem w starszych gazetach są prawidłowe, ponieważ model traktuje każdą stronę jako obraz.

Automatycznie obsługiwane. Dwukolumnowy styl IEEE to najczęstszy układ arXiv i Nougat odwija go do właściwego zamówienia odczytu bez flagi konfiguracyjnej.

Tak – inline `[12]` / `[Smith20]’ markery pozostają tam, gdzie mają miejsce, a pełna lista referencyjna na końcu jest wydobywana nietknięta dla zastosowania w dół BibTeX / Zotero.

~8-15 sec/page. 12-stroniowy dokument konferencyjny zajmuje ~2-3 min. NeuriPS-style 30+ strony papiery z dodatkami: 8-12 min. Wyślij i odejdź.

300 tokenów/stranica, piętro 600. Większość arXiv dokumentów konferencyjnych (8-15 stron) to 2400-4.500 tokenów. Codziennie bezpłatny basen pokrywa ~1-2 papierów/dzień dla podpisanych użytkowników; płatne plany są nieograniczone.

Podaj go do ChatGPT_ Claude dla "objaśnienia tego papieru", zbuduj osobisty RAG nad zapisanymi papierami, semantycznie-poszukiwaj listę czytania, kopiuj równania do własnego projektu LaTeX lub czytaj jako zwykły tekst na telefonie.

Tak — Nougat OCR wewnętrznie. arXiv został oddany LaTeX przez 25+ lat, tak że większość preprintów są czyste cyfrowe. Starsze skanowane papiery pracują, ale matematyka wierność nieznacznie spada; reskanować 300+ DPI dla najlepszych wyników.

PDF usunięte bezpośrednio po ekstrakcji. Wyjście LaTeX jest trzymane 24h (anonimowe) / 7 dni (połączenie płatne). Nigdy nie używane do treningu. arXiv PDFs są publicznie CC-BY, ale nie przechowywamy w żadnym razie.

Tak — POST multipart `file' do /v1/document/academic-pdf /. Odpowiedź JSON z `text_url`, `pages`, `preview`, `tokens`, `share_url`. Authentic nosiciela (sk-freee-...) daje 10K darmowe tokeny/miesiąc. /api/ dla przykladu curl.

Zarejestruj się bezpłatnie na 30 000 żetonów

Utwórz bezpłatne konto

Karta kredytowa nie jest wymagana

Jak mógłbyś ocenić to narzędzie?

Love this tool? Share it!