GOT-OCR v2
Free.ai
·
ocr
·
~500 znaki na page
GOT-OCR v2 is a Model OCR. Skierowane przez modele zewnętrzne — ~500 tokeny na stronę (50% markingu nad kosztami strumienia).
Użyj przez API
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
Dokumentacja API
Pobierz klucz API
Często zadawane pytania
GOT-OCR v2 extracts tekst z obrazków i PDF. Wyślij skanowaną stronę, obrazek ekranu lub zdjęcie dokumentu i GOT-OCR v2 zwraca tekst — zachowanie przerw linii i (na silnikach) tabele, formuły i strukturę.
GOT-OCR v2 obsługuje dziesiątki skryptów — Łaciński, Cyrylica, CJK, Arabski, Devanagari, i więcej. /okr/ lądowanie ma pełną listę językową na silnik.
Tak dla czystego pisemnego pisania w stylu drukowanym; krzywdziwe i skrócone są trudniejsze. TrOCR i nowoczesne silniki oparte na transformatorach są zauważalnie lepsze niż dziedzictwo Tesseract na pisaniu.
Silniki świadome układu (GOT-OCR, Marker, Florence-2) zwracają markdown/HTML tabele i LaTeX dla wzorów. Silniki prostego tekstu zwracają tekst bez struktury – sprawdź tryb wyjścia tego modelu.
GOT-OCR v2 to premium OCR silnik. Około ~500–1,500 żetonów na stronę. $1 = 750 000 żetonów.
PNG, JPG, WebP, HEIC, BMP, plus jednostraniowe i wielostraniowe PDF do 50 MB. Przed ekstrakcją strony obrotowane lub przesunięte są automatycznie skorygowane.
Dokładność znaków jest zazwyczaj >98% na czystych drukowanych stronach, obniżenie na zdjęciach niskopasmowych, poważnie skanowane skanowanie lub niezwykłe czcionki. Porównaj silniki na /okr/porównaj/ w przypadku znaczenia dokładności.
Tak — /batch/ akceptuje folder z obrazami/PDF. Każde wydobycie ląduje w /account /?tab=history. Do zachowania folderów- drewna używaj API.
Tak — POST Twój plik do /v1/okr/ z modelem="GOT-OCR v2". Zwraca JSON z tekstem + (jeżeli jest obsługiwany) układ + ramki graniczące na poziomie słowa. /api/ ma pełne odniesienie.
Samodzielne modele trzymaj pliki na naszych GPU; premium przejść z DPA. Dokumenty są usuwane po okienku share-Window. Nie trenujemy na wejściach.
Tak — Free.ai przyznaje komercyjne wykorzystanie wyciągniętego tekstu. Potrzebujesz praw do dokumentu źródłowego.
Zazwyczaj 1-5 sekund na stronę. Silniki świadome układu (stoły, matematyka) trwają dłużej. Wielostraniowa skala PDF w przybliżeniu liniowa.