TrOCR Base

Free.ai (self-hosted) · ocr · ~300 Token je page

Dokument / Bild hochladen

Eine Datei hier ablegen oder zum Durchsuchen klicken

~300 Token je page

_ Am stärksten bei Handwritten documents, low-resource scripts.. Selbstgehostet auf Free.ai GPUs — läuft kostenlos gegen Ihren täglichen Tokenpool ({tpm__tokens} pro Seite). Veröffentlicht unter MIT — kommerzielle Nutzung erlaubt auf Free.ai.

Verwendung über API

OpenAI-kompatible REST API. Generieren Sie einen Schlüssel und rufen Sie dieses Modell in Sekundenschnelle auf.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"trocr-base","prompt":"your prompt here"}'

API-Dokumentation API-Schlüssel abrufen

Häufig gestellte Fragen

TrOCR Base extrahiert Text aus Bildern und PDFs. Laden Sie eine gescannte Seite, einen Screenshot oder ein Foto eines Dokuments hoch und TrOCR Base gibt den Text zurück – indem Sie Zeilenumbrüche und (auf fähigen Motoren) Tabellen, Formeln und Struktur beibehalten.

TrOCR Base behandelt Dutzende von Skripten — Latein, Kyrillisch, CJK, Arabisch, Devanagari und mehr. Die /ocr/Landung hat die vollständige Sprachliste pro Triebwerk.

Ja für saubere bedruckte Handschrift; Cursive und Shorthand sind härter. TrOCR und moderne Transformer-basierte Motoren sind deutlich besser als bisherige Tesseract auf der Handschrift.

Layout-aware-Engines (GOT-OCR, Marker, Florence-2) geben Markdown/HTML-Tabellen und LaTeX für Formeln zurück. Klartext-Engines geben Text ohne Struktur zurück — überprüfen Sie den Ausgabemodus dieses Modells.

TrOCR Base läuft auf unseren GPUs von Ihrem täglichen kostenlosen Pool; $5 → 200.000 bezahlte Tokens nach. ~300 Tokens pro Seite.

PNG, JPG, WebP, HEIC, BMP sowie ein- und mehrseitige PDFs bis zu 50 MB. Gesponnene oder gedrehte Seiten werden vor der Extraktion automatisch korrigiert.

Charaktergenauigkeit ist in der Regel > 98% auf sauberen gedruckten Seiten, fallen auf Low-Res-Fotos, stark verzerrt Scans oder ungewöhnliche Schriften. Vergleichen Sie Motoren auf /ocr/compare/ wenn Genauigkeit zählt.

Ja — /batch/ akzeptiert einen Ordner von Bildern/PDFs. Jede Extraktion landet in /account/?tab=history. Zur Erhaltung von Ordnern verwenden Sie die API.

Ja — POSTen Sie Ihre Datei auf /v1/ocr/ mit model="TrOCR Base". Gibt JSON mit Text + (wenn unterstützt) Layout + Wort-Level-Grenzkästen zurück. /api/ hat die vollständige Referenz.

Selbst gehostete Modelle behalten Ihre Datei auf unseren GPUs; Premium-Durchlauf mit einem DPA. Dokumente werden nach dem Share-Fenster gelöscht. Wir trainieren nicht auf Ihren Eingängen.

Ja — Free.ai gewährt kommerzielle Verwendung von extrahiertem Text. Sie benötigen Rechte an dem Quelldokument.

1–5 Sekunden pro Seite typischerweise. Layout-aware-Engines (Tabellen, Mathematik) länger dauern. Mehrseitige PDFs skalieren grob linear.

TrOCR Base

Verwendung über API

Ähnliche Modelle

Häufig gestellte Fragen

Was macht TrOCR Base?

Welche Sprachen unterstützen TrOCR Base?

Kann TrOCR Base Handschrift lesen?

Bewahrt TrOCR Base Tabellenstruktur oder Mathematikformeln?

Wie viel kostet TrOCR Base pro Seite?

Welche Eingabeformate akzeptieren TrOCR Base?

Wie genau ist TrOCR Base?

Kann ich OCR mit TrOCR Base chargen?

Gibt es eine API für TrOCR Base?

Was ist mit der Privatsphäre, wenn ich OCR sensible Dokumente mit TrOCR Base?

Ist die Ausgabe TrOCR Base für den kommerziellen Gebrauch sicher?

Wie lange dauert TrOCR Base?

Erhalten Sie 10.000 kostenlose Token

Warten Sie — Holen Sie sich 10K kostenlose Token!

Willst du mehr?