GOT-OCR v2
Free.ai
·
ocr
·
~500 Token je page
_ Durch externe Modelle geleitet — ~{tpm__tokens} pro Seite (50% Markup gegenüber den vorgelagerten Kosten).
Verwendung über API
OpenAI-kompatible REST API. Generieren Sie einen Schlüssel und rufen Sie dieses Modell in Sekundenschnelle auf.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
API-Dokumentation
API-Schlüssel abrufen
Häufig gestellte Fragen
GOT-OCR v2 extrahiert Text aus Bildern und PDFs. Laden Sie eine gescannte Seite, einen Screenshot oder ein Foto eines Dokuments hoch und GOT-OCR v2 gibt den Text zurück – indem Sie Zeilenumbrüche und (auf fähigen Motoren) Tabellen, Formeln und Struktur beibehalten.
GOT-OCR v2 behandelt Dutzende von Skripten — Latein, Kyrillisch, CJK, Arabisch, Devanagari und mehr. Die /ocr/Landung hat die vollständige Sprachliste pro Triebwerk.
Ja für saubere bedruckte Handschrift; Cursive und Shorthand sind härter. TrOCR und moderne Transformer-basierte Motoren sind deutlich besser als bisherige Tesseract auf der Handschrift.
Layout-aware-Engines (GOT-OCR, Marker, Florence-2) geben Markdown/HTML-Tabellen und LaTeX für Formeln zurück. Klartext-Engines geben Text ohne Struktur zurück — überprüfen Sie den Ausgabemodus dieses Modells.
GOT-OCR v2 ist ein Premium-OCR-Engine. Etwa ~500–1.500 Token pro Seite. $1 = 750.000 Token.
PNG, JPG, WebP, HEIC, BMP sowie ein- und mehrseitige PDFs bis zu 50 MB. Gesponnene oder gedrehte Seiten werden vor der Extraktion automatisch korrigiert.
Charaktergenauigkeit ist in der Regel > 98% auf sauberen gedruckten Seiten, fallen auf Low-Res-Fotos, stark verzerrt Scans oder ungewöhnliche Schriften. Vergleichen Sie Motoren auf /ocr/compare/ wenn Genauigkeit zählt.
Ja — /batch/ akzeptiert einen Ordner von Bildern/PDFs. Jede Extraktion landet in /account/?tab=history. Zur Erhaltung von Ordnern verwenden Sie die API.
Ja — POSTen Sie Ihre Datei auf /v1/ocr/ mit model="GOT-OCR v2". Gibt JSON mit Text + (wenn unterstützt) Layout + Wort-Level-Grenzkästen zurück. /api/ hat die vollständige Referenz.
Selbst gehostete Modelle behalten Ihre Datei auf unseren GPUs; Premium-Durchlauf mit einem DPA. Dokumente werden nach dem Share-Fenster gelöscht. Wir trainieren nicht auf Ihren Eingängen.
Ja — Free.ai gewährt kommerzielle Verwendung von extrahiertem Text. Sie benötigen Rechte an dem Quelldokument.
1–5 Sekunden pro Seite typischerweise. Layout-aware-Engines (Tabellen, Mathematik) länger dauern. Mehrseitige PDFs skalieren grob linear.