GOT-OCR v2
Free.ai
·
ocr
·
~500 tokens pr. page
GOT-OCR v2 er {articleOCR-model}. Rutet gennem eksterne modeller ~{tpm_tokens} pr. side (50% markup over opstrøms omkostninger).
Brug via API
OpenAI-kompatibel REST API. Generer en nøgle og ring til denne model på få sekunder.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
API- dokumentation
Hent API- nøgle
Ofte stillede spørgsmål
GOT-OCR v2 udtrækker tekst fra billeder og PDF-filer. Upload en scannet side, et screenshot, eller et foto af et dokument og GOT-OCR v2 returnerer teksten til at bevare linjebrud og (på egnede motorer) tabeller, formler og struktur.
GOT-OCR v2 håndterer snesevis af scripts latin, kyrillisk, CJK, arabisk, Devanagari og meget mere. /ocr/ landing har den fulde sprogliste pr motor.
Ja til ren tryk-stil håndskrift; kursiv og korthånd er sværere. TrOCR og moderne transformer-baserede motorer er mærkbart bedre end arven Tesseract på håndskrift.
Layout-aware motorer (GOT-OCR, Marker, Florence-2) returnerer Markdown / HTML tabeller og LaTeX for formler. Plain-tekst motorer returnere tekst uden struktur Tjek denne models output mode.
GOT-OCR v2 er en luksus OCR motor. Om ~ 500 ~ 1.500 tokens per side. $ 1 = 750.000 tokens.
PNG, JPG, WebP, HEIC, BMP, plus single- og multi-page PDF-filer op til 50 MB. Skewed eller roterede sider er automatisk korrigeret før udvinding.
Karakternøjagtighed er typisk >98% på rene trykte sider, faldende på lav-res billeder, alvorligt skæve scanninger eller usædvanlige skrifttyper. Sammenlign motorer på /ocr/sammenlign / når nøjagtigheden betyder noget.
Ja! /batch/ accepterer en mappe med billeder/PDF'er. Hver udvinding lander i /account/?tab=historie. For mappe- træ bevaring bruge API.
Ja! Indsæt din fil til /v1/ocr/ med model="GOT-OCR v2". Returnerer JSON med tekst + (når understøttet) layout + word- level grænsebokse. /api/ har den fulde reference.
Selv-hostet modeller holde din fil på vores GPU'er; premium passere igennem med en DPA. Dokumenter slettes efter aktie-vinduet. Vi træner ikke på dine indgange.
Ja! Free.ai giver kommerciel brug af udtrukket tekst. Du har brug for rettigheder til kildedokumentet.
5 sekunder pr side typisk. Layout-aware motorer (tabeller, matematik) tager længere tid. Multi-side PDF-filer skala omtrent lineært.