Ekstraktor PDF PDF do tekstu Ekstraktor papieru akademickiego Dokument badawczy do tekstu ArXiv ekstraktor PDF Więcej →

PDF do markdown

Q: Jak się zajmuje matematyką / równaniami?

Większość równań podanych przez LaTeX przechodzi jako inline `$...$` Markdown matematyka. Dla papierów badawczych z ciężkiej matematyki, oferujemy również narzędzie akademicko-papier-extract (Nougat), które jest specjalnie nastawione na równania i cytaty.

Q: Jak szybko jest?

Około 5-10 sekund na stronę na naszym H200. Sprawozdanie o 30 stronach to ~3-5 minut. Mały model oznacza, że partie małych PDF są zasadniczo wolne w codziennym basenie.

Q: Ile to kosztuje?

200 tokenów na stronę, z podłogą 500 token. 5-stronicowy kontrakt = 1000 tokenów. 30-stronicowy raport = 6000 tokenów. 5K bezpłatny basen obejmuje najbardziej typowe użycie.

Q: Jakie formaty wejściowe?

PDF — rodzimy-digitalny + skanowany zarówno obsługiwany. Max 50 MB wysłanie. Inne formaty dokumentów (DOCX, EPUB, HTML itp.) znajdują się w planie działania; najpierw przesłanie-i-convert z narzędziem pdf-conversion.

Wykorzystanie handlowe OK Modele 380+ Brak znaku wodnego Nie ma potrzeby rejestracji

Wyrzuć PDF – SI przekonwertuje go w czyste markowanie GitHub-smażone z pozycjami, paragrafami, listami, tabelami i blokami kodowymi wszystkich zachowanych. Zachowane przez IBM Granite-Docling-258M (Apache 2.0). Szybciej + mądrzejsza niż zwykłe ekstrakcje tekstu.

Przekonwertuj dowolny PDF na czysty GitHub-smażony Markdown z nagłówkami, tabelami, listami i blokami kodowymi zachowanych. Zasilany przez IBM Granite-Docling. Darmowy, nieograniczony, bez rejestracji.

Jak stosować lek PDF do markdown

Wprowadź swoje wpisy

Wpisz tekst, wyślij plik lub opisz, czego chcesz. Nie jest potrzebne konto.

Kliknij wygenerować

Nasz SI przetwarza Twoją prośbę w sekundach przy użyciu najlepszych modeli open-source.

Pobierz & dzielenie

Pobierz, kopiuj lub podziel się swoim wynikiem. Darmowe do użytku osobistego i komercyjnego.

Użyj tego narzędzia przez API

Automatyzuj to narzędzie z własnego kodu. Kompatybilny z OpenAI REST punkt końcowy, Authentic-Bearer-token, nie jest wymagany dodatkowy SDK. Koszty token pasują do interfejsu internetowego.

Dokumentacja API Pobierz klucz API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF do markdown tool on: ..."}]}'

Powiązane narzędzia bezpłatnego SI

Ekstraktor PDF

PDF do tekstu

Ekstraktor papieru akademickiego

Dokument badawczy do tekstu

ArXiv ekstraktor PDF

PDF do markdown — FAQ

Wrzuć w dowolny PDF i SI przekonwertuje go w czyste markdown GitHub-smatrane – działy pozostania pozycjami, tabele pobytu, listy pobytów, bloki kodowe pozostania bloki kodowe. Przechodzi daleko poza zwykłe ekstrakcje tekstu; hierarchia strukturalna dokumentu jest zachowana, aby można wrzucić wyjście prosto do dokumentów, rurociąg LLM RAG lub indeks wyszukiwania.

IBM Granite-Docling-258M (Apache 2.0). Mały model wizji-do-sekwencji dobrze przystosowany do konwersji dokumentów świadomych układów – pokonuje pdftotext + dużo szybciej + mądrzejszy niż uruchomienie modelu ogólnego wizjo-języka na każdej stronie.

pdftotext to płaski sypialnia – paragrafy i tabele zapadają w ścianę słów. Adobe Export to Word zachowuje układ, ale produkuje.docx + koszty ~15/mo. Docling zachowuje strukturę SEMANTIC (poziomy pozycji, listy listy, tabele jako tablice Markdown) i wyjścia formatu LLM i narzędzia dev mogą zarówno zużywać na własny rachunek.

LlamaParsz i niestrukturyzowany zarówno posiadają bezpłatne poziomy, ale strony cap/miesiąc i wymagają klucza API. Docling-258M działa lokalnie na naszym GPU + jest w pełni samorządzony Apache 2.0, brak na stronę, bez rejestracji kluczy. Jakość jest konkurencyjna z LlamaParsz na standardowych dokumentach.

Tak — tabele wracają jako odpowiednie tabele rur markdown. Kompleksowe stoły wielokolumnowe / zagnieżdżone są bardziej agresywnie (podstawowe ograniczenie markdown, nie wady modelu). Dla doskonałej wierności tabeli, wspieramy również `format=html' za pośrednictwem API, który zachowuje rzędy/kolpan.

Granite-Docling robi sam krok OCR – działa na narodzinno-cyfrowych i skanowanych PDF. Skanowany w niższym DPI (<150) traci pewne dokładności tekstu; przeskanuj przy 200+ DPI dla najlepszych wyników.

Większość równań podanych przez LaTeX przechodzi jako inline `$...$` Markdown matematyka. Dla papierów badawczych z ciężkiej matematyki, oferujemy również narzędzie akademicko-papier-extract (Nougat), które jest specjalnie nastawione na równania i cytaty.

Około 5-10 sekund na stronę na naszym H200. Sprawozdanie o 30 stronach to ~3-5 minut. Mały model oznacza, że partie małych PDF są zasadniczo wolne w codziennym basenie.

200 tokenów na stronę, z podłogą 500 token. 5-stronicowy kontrakt = 1000 tokenów. 30-stronicowy raport = 6000 tokenów. 5K bezpłatny basen obejmuje najbardziej typowe użycie.

PDF — rodzimy-digitalny + skanowany zarówno obsługiwany. Max 50 MB wysłanie. Inne formaty dokumentów (DOCX, EPUB, HTML itp.) znajdują się w planie działania; najpierw przesłanie-i-convert z narzędziem pdf-conversion.

Przetwarzane natychmiast, wyjście Markdown jest utrzymywane (24h anonimowe / 7d zapłacone wygaśnięcie akcjonariusza), źródło PDF jest usuwane bezpośrednio po ekstrakcji. Nigdy nie używane do treningu. /privacy / dla pełnej polityki.

Tak — POST multipart `file` do /v1/document/pdf-to-markdown /. Zwraca {markdown_url, strony, podgląd, tokeny, share_url}. Bearer auth (sk-free-...) daje 10K darmowe tokeny/miesiąc. /api / ma przykład curl.

Zarejestruj się bezpłatnie na 30 000 żetonów

Utwórz bezpłatne konto

Karta kredytowa nie jest wymagana

Jak mógłbyś ocenić to narzędzie?

PDF do markdown

Wynik

Jak stosować lek PDF do markdown

Wprowadź swoje wpisy

Kliknij wygenerować

Pobierz & dzielenie

Użyj tego narzędzia przez API

Powiązane narzędzia bezpłatnego SI

PDF do markdown — FAQ

Co to jest SI PDF do Markdown?

Który model go napędza?

W jaki sposób różni się on od pdftotext / Adobe eksport?

W jaki sposób porównywa się on z LlamaParsz / unstructed.io?

Zajmuje się stołami?

A co z skanowanymi (image) PDF?

Jak się zajmuje matematyką / równaniami?

Jak szybko jest?

Ile to kosztuje?

Jakie formaty wejściowe?

Czy przesłane PDF są przechowywane?

Jest jakiś API?

Zdobądź 10 tysięcy darmowych tokenów

Poczekaj, zdobądź 10 tysięcy darmowych toków!

Chcesz więcej?