PDF 추출기 PDF에서 텍스트로 학술 논문 추출기 연구 논문 텍스트 arXiv PDF 추출기Name 더 →

PDF에서 Markdown으로

Q: 수학/방정식을 어떻게 처리합니까?

대부분의 LaTeX 렌더링 방정식은 인라인 `$...$` Markdown math로 표시됩니다. 수학이 많은 연구 논문을 위해, 우리는 또한 방정식과 인용문을 위해 특별히 조정된 academic-paper-extract 도구 (Nougat)를 제공합니다.

Q: 얼마나 빠르죠?

H200에서 페이지당 약 5-10초, 30페이지 보고서는 약 3-5분이 소요됩니다. 작은 모델은 일일 풀에서 작은 PDF 배치를 근본적으로 무료로 제공합니다.

Q: 얼마나 드나요?

페이지당 200 토큰, 500 토큰 플로어. 5 페이지 계약 = 1,000 토큰. 30 페이지 보고서 = 6,000 토큰. 5K 일일 무료 풀은 대부분의 일반적인 사용을 커버합니다.

Q: 어떤 입력 형식?

PDF — 디지털 + 스캔 모두 지원. 최대 50 MB 업로드. 다른 문서 형식 (DOCX, EPUB, HTML, 등)은 로드맵에; 지금은 업로드-and-변환 pdf-변환 도구로 먼저.

상업적 사용 OK 380+ 모델 워터마크 없음 가입이 필요하지 않습니다

PDF를 드롭 — AI가 PDF를 헤더, 단락, 목록, 표, 코드 블록이 모두 보존된 깨끗한 GitHub 풍의 Markdown으로 변환합니다. IBM Granite-Docling-258M(Apache 2.0) 기반. 일반 텍스트 추출보다 빠르고 스마트합니다.

모든 PDF를 헤더, 테이블, 목록, 코드 블록이 보존된 깨끗한 GitHub 맛 Markdown으로 변환합니다. IBM Granite-Docling에 의해 구동. 무료, 무제한, 가입 없음.

사용 방법 PDF에서 Markdown으로

입력을 입력하십시오

텍스트를 입력하거나 파일을 업로드하거나 원하는 내용을 설명하세요. 계정이 필요하지 않습니다.

생성하기를 클릭하십시오

당사의 AI는 최고의 오픈 소스 모델을 사용하여 몇 초 만에 요청을 처리합니다.

다운로드 및 공유

다운로드, 복사 또는 결과를 공유. 개인 및 상업용 무료.

API를 통해 이 도구를 사용

이 도구를 자신의 코드로 자동화하세요. OpenAI 호환 REST 엔드포인트, 베어러 토큰 인증, 추가 SDK 필요 없음. 토큰 비용은 웹 인터페이스와 일치합니다.

API 문서화 API 키 가져오기

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the PDF에서 Markdown으로 tool on: ..."}]}'

PDF에서 Markdown으로 — FAQ

PDF를 드래그하면 AI가 깨끗한 GitHub 풍미의 Markdown으로 변환합니다. 헤더는 헤더로 남고, 테이블은 테이블로 남고, 목록은 목록으로 남고, 코드 블록은 코드 블록으로 남습니다. 일반 텍스트 추출을 훨씬 뛰어넘습니다. 문서의 구조적 계층 구조가 보존되므로 출력을 문서 사이트, LLM RAG 파이프라인 또는 검색 인덱스로 바로 드래그할 수 있습니다.

IBM Granite-Docling-258M (Apache 2.0). 레이아웃 인식 문서 변환을 위해 미세 조정된 작은 비전-시퀀스 모델 - 각 페이지에서 일반적인 비전 언어 모델을 실행하는 것보다 pdftotext를 훨씬 빠르게 + 스마트하게 이길 수 있습니다.

pdftotext는 단락과 테이블이 단어의 벽으로 축소되는 평면 덤프입니다. Adobe Export to Word는 레이아웃을 보존하지만.docx +를 생성합니다. 비용은 월 15달러 정도입니다. Docling은 SEMANTIC 구조(헤더 레벨, 목록으로 목록, Markdown 테이블로 테이블)를 보존하고 LLM 및 개발 도구가 모두 네이티브로 소비 할 수있는 형식으로 출력합니다.

LlamaParse와 unstructured는 모두 무료 계층이 있지만 월별 페이지 수 제한이 있으며 API 키가 필요합니다. Docling-258M은 우리의 GPU +에서 로컬로 실행되며 페이지당 측정이 없고 키 등록이 없는 완전히 자체 호스팅된 Apache 2.0입니다. 표준 문서에서 LlamaParse와 경쟁력이 있습니다.

네 — 테이블은 적절한 Markdown 파이프 테이블로 반환됩니다. 복잡한 다중 열 / 중첩된 테이블은 더욱 공격적으로 평평하게 표시됩니다(Markdown의 기본적인 한계이지 모델의 잘못이 아닙니다). 완벽한 테이블 충실도를 위해, 우리는 또한 행 간격/열 간격을 보존하는 API를 통해 `format=html`를 지원합니다.

Granite-Docling은 OCR 단계를 자체적으로 수행합니다. 디지털 및 스캔된 PDF에서 동일하게 작동합니다. 더 낮은 DPI(<150)로 스캔하면 텍스트 정확도가 약간 손실됩니다.

대부분의 LaTeX 렌더링 방정식은 인라인 `$...$` Markdown math로 표시됩니다. 수학이 많은 연구 논문을 위해, 우리는 또한 방정식과 인용문을 위해 특별히 조정된 academic-paper-extract 도구 (Nougat)를 제공합니다.

H200에서 페이지당 약 5-10초, 30페이지 보고서는 약 3-5분이 소요됩니다. 작은 모델은 일일 풀에서 작은 PDF 배치를 근본적으로 무료로 제공합니다.

페이지당 200 토큰, 500 토큰 플로어. 5 페이지 계약 = 1,000 토큰. 30 페이지 보고서 = 6,000 토큰. 5K 일일 무료 풀은 대부분의 일반적인 사용을 커버합니다.

PDF — 디지털 + 스캔 모두 지원. 최대 50 MB 업로드. 다른 문서 형식 (DOCX, EPUB, HTML, 등)은 로드맵에; 지금은 업로드-and-변환 pdf-변환 도구로 먼저.

즉시 처리, Markdown 출력은 유지됩니다 (24 시간 익명 / 7 일 유료 공유 링크 만료), 소스 PDF는 추출 후 바로 삭제됩니다. 훈련에 사용되지 않습니다. / 개인 정보 보호 정책의 전체.

Yes — 다중 파일을 /v1/document/pdf-to-markdown/로 POST합니다. {markdown_url, pages, preview, tokens, share_url}를 반환합니다. Bearer auth (sk-free-…)는 10K의 무료 토큰을 제공합니다. /api/는 curl 예제를 가지고 있습니다.

30,000 토큰을 무료로 등록하세요

무료 계정 만들기

신용카드 필요 없음

이 도구를 어떻게 평가하시겠습니까?

PDF에서 Markdown으로

결과

사용 방법 PDF에서 Markdown으로

입력을 입력하십시오

생성하기를 클릭하십시오

다운로드 및 공유

API를 통해 이 도구를 사용

관련 무료 AI 도구

PDF에서 Markdown으로 — FAQ

AI PDF to Markdown은 무엇입니까?

어떤 모델이 전원을 공급합니까?

어떻게 pdftotext / Adobe 내보내기와 다릅니까?

LlamaParse / unstructured.io와 비교하면 어떤가요?

테이블을 처리합니까?

스캔된 (이미지) PDF는 어떨까요?

수학/방정식을 어떻게 처리합니까?

얼마나 빠르죠?

얼마나 드나요?

어떤 입력 형식?

업로드한 PDF가 저장되나요?

API가 있습니까?

10,000 무료 토큰 받기

기다려요 — 10K 무료 토큰 받기!

더 먹고 싶어?