PDFден Markdownга

Коммерциялык колдонууга ыңгайлуу 380+ модели Водный знак жок Кирүү зарыл эмес
Модель:
+ GPT-5, Claude, Gemini
PDF файлын таштап кетүү — AI аны таза GitHub-style Markdown форматына айландырат, ал эми аталыштар, абзацтар, тизмелер, таблицалар жана код блоктору сакталат. IBM Granite-Docling-258M (Apache 2.0) менен иштелип чыккан. Текстти чыгаруудан тез жана акылдуу.

PDF файлын бул жакка таштаңыз же жүктөп алуу үчүн чыкылдатыңыз

PDF 50 МБга чейин. ~200 символ бир бетке.

Маркдаун форматын чыгаруу... ~5-10 сек/барак
Кеңири параметрлер
Жыйынтык
Токендер аз. Жаңы жетондор
Жакшы натыйжалар керекпи? Premium моделдери (GPT-5, Claude, Gemini) жогорку сапатты камсыз кылат. Пландарды көрүү
Дагы керекпи? 30K токендер/күн + 10K бонус үчүн акысыз катталуу
Акысыз каттоо

Сиздин сурооңуз иштелип жатат...

Бардык PDF файлдарын таза GitHub-style Markdown форматына айландыруу, ал эми аталыштар, таблицалар, тизмелер жана код блоктору сакталат. IBM Granite-Docling тарабынан иштелип чыккан. Акысыз, чексиз, каттоосуз.

Колдонуу PDFден Markdownга

1
Ката жазылды

Текст киргизиңиз, файлды жүктөңүз же каалаган нерсеңизди баяндаңыз. Эч кандай эсеп-кысап керек эмес.

2
Жаңылоо үчүн чыкылдатыңыз

Биздин AI сиздин сурооңузду секундаларда иштетет, эң мыкты ачык булактуу моделдерди колдонуп.

3
Жүктөп алуу жана бөлүшүү

Жүктөп алуу, көчүрүү же натыйжаны бөлүшүү. Жеке жана коммерциялык колдонуу үчүн акысыз.

Бул аспапты API аркылуу колдонуу

Бул аспапты өз кодуңуздан автоматташтырыңыз. OpenAI-кабалашкан REST endpoint, Bearer-token auth, кошумча SDK керек эмес. Токендердин баасы веб-интерфейске окшош.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDFден Markdownга tool on: ..."}]}'

PDFден Markdownга — FAQ

PDF файлын киргизип, AI аны таза GitHub-style Markdown форматына айландырат — заголовки остаются заголовками, таблицы остаются таблицами, списки остаются списками, кодовые блоки остаются кодовыми блоками. Этот метод идет дальше простого извлечения текста; документтин структуралык иерархия сакталат, андыктан сиз документтерди түз эле docs сайтка, LLM RAG конвейерине же издөө индексине киргизе аласыз.

IBM Granite-Docling-258M (Apache 2.0). Тиничектүү "визуалдык-секунддук" модели, макет-ачык документтерди конвертациялоо үчүн ыңгайлаштырылган - pdftotextти жеңет + ар бир бетте жалпы "визуалдык-тил" моделин иштетүүдөн алда канча тез + акылдуу.

pdftotext - бул баракчаларды жана таблицаларды сөздөрдүн дубалына айланткан плакат. Adobe Export to Word макетти сактайт, бирок.docx форматын чыгарат + баасы ~$15/mo. Docling семантикалык структураны сактайт (баштык деңгээлдери, тизмелер катары тизмелер, таблицалар катары Markdown таблицалары) жана LLMs жана dev инструменттери экөө тең өз алдынча колдоно турган форматта чыгат.

LlamaParse жана unstructured экисинин да акысыз түрү бар, бирок айына бир бетке чейин чектөө бар жана API ачкыч керек. Docling-258M локалдык GPU + менен иштейт, толугу менен өзүнчө Apache 2.0, барактын өлчөмү жок, ачкычты каттоо жок. Стандарттык документтерде сапаты LlamaParse менен атаандаштыкка туруштук берет.

Да — таблицалар туура Markdown-таблицалар катары кайтарылат. Комплекстүү көп-стулпандуу / уюшкан таблицалар агрессивдүү түрдө ылдыйга жылдырылат (Markdownдун фундаменталдык чектөөсү, модельдин катасы эмес). Таблицанын толук тактыгы үчүн биз rowspan/colspanди сактаган API аркылуу `format=html`ди колдойбуз.

Granite-Docling OCR кадамын өзү аткарат — ал цифралык жана скандалашкан PDF файлдары менен бирдей иштей алат. Төмөнкү DPI (<150) менен скандалганда тексттин тактыгы жоголот; мыкты натыйжа үчүн 200+ DPI менен кайра скандалоого болот.

LaTeX-те көрсөтүлгөн теңдемелердин көбү `$...$` Markdown math катары көрсөтүлөт. Математикалык тексттер үчүн биз academic-paper-extract (Nougat) программасын сунуштайбыз, ал теңдемелер жана цитаталар үчүн атайын иштелип чыккан.

5-10 секунданын бир бети боюнча биздин H200. 30-баракча отчету ~ 3-5 мүнөт. Кичинекей модель кичинекей PDF файлдарынын партиялары күн сайын акысыз.

Бир барак үчүн 200 жетон, 500 жетондук чек менен. 5-баракчалык контракт = 1000 жетон. 30-баракчалык отчет = 6000 жетон. Күнүнө 5К акысыз топтому көпчүлүк типтүү колдонууну камтыйт.

PDF — born-digital + scanned both supported. Max 50 MB upload. Other document formats (DOCX, EPUB, HTML, etc.) on the roadmap; for now upload-and-convert with the pdf-conversion tool first.

Текстовый файл сохраняется (24 часа анонимно / 7 дней с момента получения платы за использование ссылки), исходный PDF удаляется сразу же после извлечения. Не используется для обучения. Полный текст политики см. в /privacy/.

Да — POST многочастный `файл` в /v1/document/pdf-to-markdown/. Возвращает {markdown_url, pages, preview, tokens, share_url}. Bearer auth (sk-free-…) дает 10K бесплатных токенов/месяц. /api/ имеет пример curl.

30 000 жетон үчүн акысыз катталуу

Акысыз эсеп жазуусун жаратуу

Кредиттик карта талап кылынбайт

Бул аспапты кандай баалайсыз?

Free.aiди сүйөсүңбү? Досторуңа айт!