TrOCR Base

Free.ai (self-hosted) · ocr · ~300 znaki na page

Przepuść plik tutaj lub kliknij aby przeglądać

~300 znaki na page

TrOCR Base jest a Model OCR zbudowany przez Microsoft. Najsilniejszy w Handwritten documents, low-resource scripts.. Samodzielnie umieszczony na Free.ai GPU – biegnie wolny od codziennego zbiornika żetonów (300 žetonów na stronę). Uwolnione pod {licence} — użytkowanie handlowe dozwolone na Free.ai.

Użyj przez API

Kompatybilny z OpenAI REST API. Generuj klucz i zadzwoń po ten model w sekundach.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"trocr-base","prompt":"your prompt here"}'
Dokumentacja API Pobierz klucz API

Często zadawane pytania

TrOCR Base extracts tekst z obrazków i PDF. Wyślij skanowaną stronę, obrazek ekranu lub zdjęcie dokumentu i TrOCR Base zwraca tekst — zachowanie przerw linii i (na silnikach) tabele, formuły i strukturę.

TrOCR Base obsługuje dziesiątki skryptów — Łaciński, Cyrylica, CJK, Arabski, Devanagari, i więcej. /okr/ lądowanie ma pełną listę językową na silnik.

Tak dla czystego pisemnego pisania w stylu drukowanym; krzywdziwe i skrócone są trudniejsze. TrOCR i nowoczesne silniki oparte na transformatorach są zauważalnie lepsze niż dziedzictwo Tesseract na pisaniu.

Silniki świadome układu (GOT-OCR, Marker, Florence-2) zwracają markdown/HTML tabele i LaTeX dla wzorów. Silniki prostego tekstu zwracają tekst bez struktury – sprawdź tryb wyjścia tego modelu.

TrOCR Base biegnie na naszych GPU z codziennego bezpłatnego basenu; $5 → 200 000 zapłaconych żetonów po. ~300 żetonów na stronę.

PNG, JPG, WebP, HEIC, BMP, plus jednostraniowe i wielostraniowe PDF do 50 MB. Przed ekstrakcją strony obrotowane lub przesunięte są automatycznie skorygowane.

Dokładność znaków jest zazwyczaj >98% na czystych drukowanych stronach, obniżenie na zdjęciach niskopasmowych, poważnie skanowane skanowanie lub niezwykłe czcionki. Porównaj silniki na /okr/porównaj/ w przypadku znaczenia dokładności.

Tak — /batch/ akceptuje folder z obrazami/PDF. Każde wydobycie ląduje w /account /?tab=history. Do zachowania folderów- drewna używaj API.

Tak — POST Twój plik do /v1/okr/ z modelem="TrOCR Base". Zwraca JSON z tekstem + (jeżeli jest obsługiwany) układ + ramki graniczące na poziomie słowa. /api/ ma pełne odniesienie.

Samodzielne modele trzymaj pliki na naszych GPU; premium przejść z DPA. Dokumenty są usuwane po okienku share-Window. Nie trenujemy na wejściach.

Tak — Free.ai przyznaje komercyjne wykorzystanie wyciągniętego tekstu. Potrzebujesz praw do dokumentu źródłowego.

Zazwyczaj 1-5 sekund na stronę. Silniki świadome układu (stoły, matematyka) trwają dłużej. Wielostraniowa skala PDF w przybliżeniu liniowa.

Love this tool? Share it!

Oszacuj tę stronę