TrOCR Base

Free.ai (self-hosted) · ocr · ~300 Token je page

Eine Datei hier ablegen oder zum Durchsuchen klicken

~300 Token je page

_ Am stärksten bei Handwritten documents, low-resource scripts.. Selbstgehostet auf Free.ai GPUs — läuft kostenlos gegen Ihren täglichen Tokenpool ({tpm__tokens} pro Seite). Veröffentlicht unter MIT — kommerzielle Nutzung erlaubt auf Free.ai.

Verwendung über API

OpenAI-kompatible REST API. Generieren Sie einen Schlüssel und rufen Sie dieses Modell in Sekundenschnelle auf.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"trocr-base","prompt":"your prompt here"}'
API-Dokumentation API-Schlüssel abrufen

Häufig gestellte Fragen

TrOCR Base extrahiert Text aus Bildern und PDFs. Laden Sie eine gescannte Seite, einen Screenshot oder ein Foto eines Dokuments hoch und TrOCR Base gibt den Text zurück – indem Sie Zeilenumbrüche und (auf fähigen Motoren) Tabellen, Formeln und Struktur beibehalten.

TrOCR Base behandelt Dutzende von Skripten — Latein, Kyrillisch, CJK, Arabisch, Devanagari und mehr. Die /ocr/Landung hat die vollständige Sprachliste pro Triebwerk.

Ja für saubere bedruckte Handschrift; Cursive und Shorthand sind härter. TrOCR und moderne Transformer-basierte Motoren sind deutlich besser als bisherige Tesseract auf der Handschrift.

Layout-aware-Engines (GOT-OCR, Marker, Florence-2) geben Markdown/HTML-Tabellen und LaTeX für Formeln zurück. Klartext-Engines geben Text ohne Struktur zurück — überprüfen Sie den Ausgabemodus dieses Modells.

TrOCR Base läuft auf unseren GPUs von Ihrem täglichen kostenlosen Pool; $5 → 200.000 bezahlte Tokens nach. ~300 Tokens pro Seite.

PNG, JPG, WebP, HEIC, BMP sowie ein- und mehrseitige PDFs bis zu 50 MB. Gesponnene oder gedrehte Seiten werden vor der Extraktion automatisch korrigiert.

Charaktergenauigkeit ist in der Regel > 98% auf sauberen gedruckten Seiten, fallen auf Low-Res-Fotos, stark verzerrt Scans oder ungewöhnliche Schriften. Vergleichen Sie Motoren auf /ocr/compare/ wenn Genauigkeit zählt.

Ja — /batch/ akzeptiert einen Ordner von Bildern/PDFs. Jede Extraktion landet in /account/?tab=history. Zur Erhaltung von Ordnern verwenden Sie die API.

Ja — POSTen Sie Ihre Datei auf /v1/ocr/ mit model="TrOCR Base". Gibt JSON mit Text + (wenn unterstützt) Layout + Wort-Level-Grenzkästen zurück. /api/ hat die vollständige Referenz.

Selbst gehostete Modelle behalten Ihre Datei auf unseren GPUs; Premium-Durchlauf mit einem DPA. Dokumente werden nach dem Share-Fenster gelöscht. Wir trainieren nicht auf Ihren Eingängen.

Ja — Free.ai gewährt kommerzielle Verwendung von extrahiertem Text. Sie benötigen Rechte an dem Quelldokument.

1–5 Sekunden pro Seite typischerweise. Layout-aware-Engines (Tabellen, Mathematik) länger dauern. Mehrseitige PDFs skalieren grob linear.

Love this tool? Share it!

Bewerten Sie diese Seite