PDF do markdown

Wykorzystanie handlowe OK Modele 380+ Brak znaku wodnego Nie ma potrzeby rejestracji
Wzór:
+ GPT-5, Claude, Gemini
Wyrzuć PDF – SI przekonwertuje go w czyste markowanie GitHub-smażone z pozycjami, paragrafami, listami, tabelami i blokami kodowymi wszystkich zachowanych. Zachowane przez IBM Granite-Docling-258M (Apache 2.0). Szybciej + mądrzejsza niż zwykłe ekstrakcje tekstu.

Przesuń tutaj PDF lub kliknij, aby wysłać

PDF do 50 MB. ~200 żetonów na stronę.

Wydobywanie układu świadomego Markdown... ~5-10 sec/page
Zaawansowane opcje
Wynik
Tokiny się skończyły. Zdobądź więcej tokenów
Chcesz lepsze wyniki? Modele premium (GPT-5, Claude, Gemini) dostarcza wyższej jakości. Widok planów

❤️ Love this tool? Share it!

Zaloguj się aby uzyskać link referencyjny i zarobić 25 000 żetonów na przyjaciela.

Chcesz więcej? Zarejestruj się za darmo za 30K tokeny/dzień + 10K bonus
Zarejestruj się za darmo

Przetwarzam twoją prośbę...

Przekonwertuj dowolny PDF na czysty GitHub-smażony Markdown z nagłówkami, tabelami, listami i blokami kodowymi zachowanych. Zasilany przez IBM Granite-Docling. Darmowy, nieograniczony, bez rejestracji.

Jak stosować lek PDF do markdown

1
Wprowadź swoje wpisy

Wpisz tekst, wyślij plik lub opisz, czego chcesz. Nie jest potrzebne konto.

2
Kliknij wygenerować

Nasz SI przetwarza Twoją prośbę w sekundach przy użyciu najlepszych modeli open-source.

3
Pobierz & dzielenie

Pobierz, kopiuj lub podziel się swoim wynikiem. Darmowe do użytku osobistego i komercyjnego.

Użyj tego narzędzia przez API

Automatyzuj to narzędzie z własnego kodu. Kompatybilny z OpenAI REST punkt końcowy, Authentic-Bearer-token, nie jest wymagany dodatkowy SDK. Koszty token pasują do interfejsu internetowego.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF do markdown tool on: ..."}]}'

PDF do markdown — FAQ

Wrzuć w dowolny PDF i SI przekonwertuje go w czyste markdown GitHub-smatrane – działy pozostania pozycjami, tabele pobytu, listy pobytów, bloki kodowe pozostania bloki kodowe. Przechodzi daleko poza zwykłe ekstrakcje tekstu; hierarchia strukturalna dokumentu jest zachowana, aby można wrzucić wyjście prosto do dokumentów, rurociąg LLM RAG lub indeks wyszukiwania.

IBM Granite-Docling-258M (Apache 2.0). Mały model wizji-do-sekwencji dobrze przystosowany do konwersji dokumentów świadomych układów – pokonuje pdftotext + dużo szybciej + mądrzejszy niż uruchomienie modelu ogólnego wizjo-języka na każdej stronie.

pdftotext to płaski sypialnia – paragrafy i tabele zapadają w ścianę słów. Adobe Export to Word zachowuje układ, ale produkuje.docx + koszty ~15/mo. Docling zachowuje strukturę SEMANTIC (poziomy pozycji, listy listy, tabele jako tablice Markdown) i wyjścia formatu LLM i narzędzia dev mogą zarówno zużywać na własny rachunek.

LlamaParsz i niestrukturyzowany zarówno posiadają bezpłatne poziomy, ale strony cap/miesiąc i wymagają klucza API. Docling-258M działa lokalnie na naszym GPU + jest w pełni samorządzony Apache 2.0, brak na stronę, bez rejestracji kluczy. Jakość jest konkurencyjna z LlamaParsz na standardowych dokumentach.

Tak — tabele wracają jako odpowiednie tabele rur markdown. Kompleksowe stoły wielokolumnowe / zagnieżdżone są bardziej agresywnie (podstawowe ograniczenie markdown, nie wady modelu). Dla doskonałej wierności tabeli, wspieramy również `format=html' za pośrednictwem API, który zachowuje rzędy/kolpan.

Granite-Docling robi sam krok OCR – działa na narodzinno-cyfrowych i skanowanych PDF. Skanowany w niższym DPI (<150) traci pewne dokładności tekstu; przeskanuj przy 200+ DPI dla najlepszych wyników.

Większość równań podanych przez LaTeX przechodzi jako inline `$...$` Markdown matematyka. Dla papierów badawczych z ciężkiej matematyki, oferujemy również narzędzie akademicko-papier-extract (Nougat), które jest specjalnie nastawione na równania i cytaty.

Około 5-10 sekund na stronę na naszym H200. Sprawozdanie o 30 stronach to ~3-5 minut. Mały model oznacza, że partie małych PDF są zasadniczo wolne w codziennym basenie.

200 tokenów na stronę, z podłogą 500 token. 5-stronicowy kontrakt = 1000 tokenów. 30-stronicowy raport = 6000 tokenów. 5K bezpłatny basen obejmuje najbardziej typowe użycie.

PDF — rodzimy-digitalny + skanowany zarówno obsługiwany. Max 50 MB wysłanie. Inne formaty dokumentów (DOCX, EPUB, HTML itp.) znajdują się w planie działania; najpierw przesłanie-i-convert z narzędziem pdf-conversion.

Przetwarzane natychmiast, wyjście Markdown jest utrzymywane (24h anonimowe / 7d zapłacone wygaśnięcie akcjonariusza), źródło PDF jest usuwane bezpośrednio po ekstrakcji. Nigdy nie używane do treningu. /privacy / dla pełnej polityki.

Tak — POST multipart `file` do /v1/document/pdf-to-markdown /. Zwraca {markdown_url, strony, podgląd, tokeny, share_url}. Bearer auth (sk-free-...) daje 10K darmowe tokeny/miesiąc. /api / ma przykład curl.

Zarejestruj się bezpłatnie na 30 000 żetonów

Utwórz bezpłatne konto

Karta kredytowa nie jest wymagana

Jak mógłbyś ocenić to narzędzie?

Love this tool? Share it!