TrOCR Base

Free.ai (self-hosted) · ocr · ~300 tokens pr. page

Slip en fil her eller klik for at gennemse

~300 tokens pr. page

TrOCR Base er {article{kategori}} bygget af Microsoft. Stærkeste på Handwritten documents, low-resource scripts.. Self-hostet på Free.ai GPU'er kører gratis mod din daglige token pool (300 tokens pr. side). Udgivet under MIT tilladt kommerciel brug på Free.ai.

Brug via API

OpenAI-kompatibel REST API. Generer en nøgle og ring til denne model på få sekunder.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"trocr-base","prompt":"your prompt here"}'
API- dokumentation Hent API- nøgle

Ofte stillede spørgsmål

TrOCR Base udtrækker tekst fra billeder og PDF-filer. Upload en scannet side, et screenshot, eller et foto af et dokument og TrOCR Base returnerer teksten til at bevare linjebrud og (på egnede motorer) tabeller, formler og struktur.

TrOCR Base håndterer snesevis af scripts latin, kyrillisk, CJK, arabisk, Devanagari og meget mere. /ocr/ landing har den fulde sprogliste pr motor.

Ja til ren tryk-stil håndskrift; kursiv og korthånd er sværere. TrOCR og moderne transformer-baserede motorer er mærkbart bedre end arven Tesseract på håndskrift.

Layout-aware motorer (GOT-OCR, Marker, Florence-2) returnerer Markdown / HTML tabeller og LaTeX for formler. Plain-tekst motorer returnere tekst uden struktur Tjek denne models output mode.

TrOCR Base kører på vores GPU'er fra din daglige gratis pool; $5 → 200.000 betalte tokens efter. ~300 tokens per side.

PNG, JPG, WebP, HEIC, BMP, plus single- og multi-page PDF-filer op til 50 MB. Skewed eller roterede sider er automatisk korrigeret før udvinding.

Karakternøjagtighed er typisk >98% på rene trykte sider, faldende på lav-res billeder, alvorligt skæve scanninger eller usædvanlige skrifttyper. Sammenlign motorer på /ocr/sammenlign / når nøjagtigheden betyder noget.

Ja! /batch/ accepterer en mappe med billeder/PDF'er. Hver udvinding lander i /account/?tab=historie. For mappe- træ bevaring bruge API.

Ja! Indsæt din fil til /v1/ocr/ med model="TrOCR Base". Returnerer JSON med tekst + (når understøttet) layout + word- level grænsebokse. /api/ har den fulde reference.

Selv-hostet modeller holde din fil på vores GPU'er; premium passere igennem med en DPA. Dokumenter slettes efter aktie-vinduet. Vi træner ikke på dine indgange.

Ja! Free.ai giver kommerciel brug af udtrukket tekst. Du har brug for rettigheder til kildedokumentet.

5 sekunder pr side typisk. Layout-aware motorer (tabeller, matematik) tager længere tid. Multi-side PDF-filer skala omtrent lineært.

Love this tool? Share it!

Bedøm denne side