TrOCR Base

Free.ai (self-hosted) · ocr · ~300 znaki na page

Wyślij dokument / obrazek

Przepuść plik tutaj lub kliknij aby przeglądać

~300 znaki na page

TrOCR Base jest a Model OCR zbudowany przez Microsoft. Najsilniejszy w Handwritten documents, low-resource scripts.. Samodzielnie umieszczony na Free.ai GPU – biegnie wolny od codziennego zbiornika żetonów (300 žetonów na stronę). Uwolnione pod {licence} — użytkowanie handlowe dozwolone na Free.ai.

Użyj przez API

Kompatybilny z OpenAI REST API. Generuj klucz i zadzwoń po ten model w sekundach.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"trocr-base","prompt":"your prompt here"}'

Dokumentacja API Pobierz klucz API

Podobne modele

GOT-OCR v2

Przeglądaj wszystkie modele →

Często zadawane pytania

TrOCR Base extracts tekst z obrazków i PDF. Wyślij skanowaną stronę, obrazek ekranu lub zdjęcie dokumentu i TrOCR Base zwraca tekst — zachowanie przerw linii i (na silnikach) tabele, formuły i strukturę.

TrOCR Base obsługuje dziesiątki skryptów — Łaciński, Cyrylica, CJK, Arabski, Devanagari, i więcej. /okr/ lądowanie ma pełną listę językową na silnik.

Tak dla czystego pisemnego pisania w stylu drukowanym; krzywdziwe i skrócone są trudniejsze. TrOCR i nowoczesne silniki oparte na transformatorach są zauważalnie lepsze niż dziedzictwo Tesseract na pisaniu.

Silniki świadome układu (GOT-OCR, Marker, Florence-2) zwracają markdown/HTML tabele i LaTeX dla wzorów. Silniki prostego tekstu zwracają tekst bez struktury – sprawdź tryb wyjścia tego modelu.

TrOCR Base biegnie na naszych GPU z codziennego bezpłatnego basenu; $5 → 200 000 zapłaconych żetonów po. ~300 żetonów na stronę.

PNG, JPG, WebP, HEIC, BMP, plus jednostraniowe i wielostraniowe PDF do 50 MB. Przed ekstrakcją strony obrotowane lub przesunięte są automatycznie skorygowane.

Dokładność znaków jest zazwyczaj >98% na czystych drukowanych stronach, obniżenie na zdjęciach niskopasmowych, poważnie skanowane skanowanie lub niezwykłe czcionki. Porównaj silniki na /okr/porównaj/ w przypadku znaczenia dokładności.

Tak — /batch/ akceptuje folder z obrazami/PDF. Każde wydobycie ląduje w /account /?tab=history. Do zachowania folderów- drewna używaj API.

Tak — POST Twój plik do /v1/okr/ z modelem="TrOCR Base". Zwraca JSON z tekstem + (jeżeli jest obsługiwany) układ + ramki graniczące na poziomie słowa. /api/ ma pełne odniesienie.

Samodzielne modele trzymaj pliki na naszych GPU; premium przejść z DPA. Dokumenty są usuwane po okienku share-Window. Nie trenujemy na wejściach.

Tak — Free.ai przyznaje komercyjne wykorzystanie wyciągniętego tekstu. Potrzebujesz praw do dokumentu źródłowego.

Zazwyczaj 1-5 sekund na stronę. Silniki świadome układu (stoły, matematyka) trwają dłużej. Wielostraniowa skala PDF w przybliżeniu liniowa.

TrOCR Base

Użyj przez API

Podobne modele

Często zadawane pytania

CoTrOCR Base do?

Jakie języki obsługuje TrOCR Base?

Czy TrOCR Base może przeczytać pismo?

Czy TrOCR Base zachować strukturę tabeli lub formuły matematyczne?

Ile kosztuje TrOCR Base na stronę?

Jakie formaty wejściowe TrOCR Base akceptuje?

Jak dokładna jest TrOCR Base?

Czy mogę wpakować OCR TrOCR Base?

Czy istnieje API dla TrOCR Base?

A co z prywatnością, gdy dokumenty wrażliwe na OCR z TrOCR Base?

Czy TrOCR Base wyjście jest bezpieczne do użytku komercyjnego?

Ile czasu zajmuje TrOCR Base?

Zdobądź 10 tysięcy darmowych tokenów

Poczekaj, zdobądź 10 tysięcy darmowych toków!

Chcesz więcej?