GOT-OCR v2

Free.ai · ocr · ~500 znaki na page

Przepuść plik tutaj lub kliknij aby przeglądać

~500 znaki na page
Bezpłatnie działa na naszych GPU. Uaktualnij dla GOT-OCR v2 →

GOT-OCR v2 is a Model OCR. Skierowane przez modele zewnętrzne — ~500 tokeny na stronę (50% markingu nad kosztami strumienia).

Użyj przez API

OpenAI-compatible REST API. Generate a key and call this model in seconds.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
Dokumentacja API Pobierz klucz API

Często zadawane pytania

GOT-OCR v2 extracts tekst z obrazków i PDF. Wyślij skanowaną stronę, obrazek ekranu lub zdjęcie dokumentu i GOT-OCR v2 zwraca tekst — zachowanie przerw linii i (na silnikach) tabele, formuły i strukturę.

GOT-OCR v2 obsługuje dziesiątki skryptów — Łaciński, Cyrylica, CJK, Arabski, Devanagari, i więcej. /okr/ lądowanie ma pełną listę językową na silnik.

Tak dla czystego pisemnego pisania w stylu drukowanym; krzywdziwe i skrócone są trudniejsze. TrOCR i nowoczesne silniki oparte na transformatorach są zauważalnie lepsze niż dziedzictwo Tesseract na pisaniu.

Silniki świadome układu (GOT-OCR, Marker, Florence-2) zwracają markdown/HTML tabele i LaTeX dla wzorów. Silniki prostego tekstu zwracają tekst bez struktury – sprawdź tryb wyjścia tego modelu.

GOT-OCR v2 to premium OCR silnik. Około ~500–1,500 żetonów na stronę. $1 = 750 000 żetonów.

PNG, JPG, WebP, HEIC, BMP, plus jednostraniowe i wielostraniowe PDF do 50 MB. Przed ekstrakcją strony obrotowane lub przesunięte są automatycznie skorygowane.

Dokładność znaków jest zazwyczaj >98% na czystych drukowanych stronach, obniżenie na zdjęciach niskopasmowych, poważnie skanowane skanowanie lub niezwykłe czcionki. Porównaj silniki na /okr/porównaj/ w przypadku znaczenia dokładności.

Tak — /batch/ akceptuje folder z obrazami/PDF. Każde wydobycie ląduje w /account /?tab=history. Do zachowania folderów- drewna używaj API.

Tak — POST Twój plik do /v1/okr/ z modelem="GOT-OCR v2". Zwraca JSON z tekstem + (jeżeli jest obsługiwany) układ + ramki graniczące na poziomie słowa. /api/ ma pełne odniesienie.

Samodzielne modele trzymaj pliki na naszych GPU; premium przejść z DPA. Dokumenty są usuwane po okienku share-Window. Nie trenujemy na wejściach.

Tak — Free.ai przyznaje komercyjne wykorzystanie wyciągniętego tekstu. Potrzebujesz praw do dokumentu źródłowego.

Zazwyczaj 1-5 sekund na stronę. Silniki świadome układu (stoły, matematyka) trwają dłużej. Wielostraniowa skala PDF w przybliżeniu liniowa.

Love this tool? Share it!

Oszacuj tę stronę