GOT-OCR v2
Free.ai
·
ocr
·
~500 tokens per page
GOT-OCR v2 adalah a Model OCR. Dilalui melalui model luaran — ~500 token setiap halaman (50% markup melebihi kos aliran atas).
Guna melalui API
OpenAI-compatible REST API. Generate a key and call this model in seconds.
curl -X POST https://api.free.ai/v1/ocr/ \
-H "Authorization: Bearer sk-free-..." \
-H "Content-Type: application/json" \
-d '{"model":"premium/got-ocr/v2","prompt":"your prompt here"}'
Dokumentasi API
Dapatkan Kekunci API
Soalan Lazim
GOT-OCR v2 mengekstrak teks dari imej dan PDF. Muat naik halaman yang diimbas, tangkap skrin, atau foto dokumen dan GOT-OCR v2 mengembalikan teks — memelihara pecahan baris dan (pada enjin yang mampu) jadual, formula, dan struktur.
GOT-OCR v2 mengendalikan berpuluh-puluh skrip — Latin, Cyrillic, CJK, Arab, Devanagari, dan lain-lain. /ocr/ landing mempunyai senarai bahasa penuh bagi setiap enjin.
Ya untuk tulisan tangan gaya cetak bersih; kursif dan tulisan pendek lebih sukar. TrOCR dan enjin berdasar-transformator moden lebih baik daripada Tesseract lama pada tulisan tangan.
Enjin yang tahu-bentangan (GOT-OCR, Marker, Florence-2) mengembalikan jadual Markdown/HTML dan LaTeX untuk formula. Enjin teks biasa mengembalikan teks tanpa struktur — semak mod output model ini.
GOT-OCR v2 adalah enjin OCR premium. Sekitar ~500–1,500 token per halaman. $1 = 750,000 token.
PNG, JPG, WebP, HEIC, BMP, plus PDF satu halaman dan berbilang halaman sehingga 50 MB. Halaman yang terbengkok atau diputar akan dibetulkan secara automatik sebelum pengekstrakan.
Ketepatan aksara biasanya >98% pada halaman cetak bersih, jatuh pada foto resolusi rendah, imbasan yang teruk terbalik, atau font tidak biasa. Bandingkan enjin pada /ocr/compare/ bila ketepatan penting.
Ya — /batch/ menerima folder imej/PDF. Setiap pengekstrakan akan berada dalam /account/?tab=history. Untuk pemeliharaan pepohon folder gunakan API.
Ya — POST fail anda ke /v1/ocr/ dengan model="GOT-OCR v2". Kembalikan JSON dengan teks + (apabila disokong) susunatur + kotak sempadan aras perkataan. /api/ mempunyai rujukan penuh.
Model sendiri-hosting menyimpan fail anda pada GPU kami; premium lalu melalui dengan DPA. Dokumen dipadam selepas tetingkap-kongsi. Kami tidak melatih pada input anda.
Ya — Free.ai memberi kebenaran penggunaan komersial teks yang diekstrak. Anda perlukan hak ke atas dokumen sumber.
1–5 saat per halaman biasanya. Enjin yang tahu susunatur (tabel, matematik) mengambil masa lebih lama. PDF berbilang halaman skala secara linear.