PaddleOCR-VL

Free.ai (self-hosted) · ocr · ~300 tokens per page

Nyelehake file ing kene utawa pencet kanggo browsing

~300 tokens per page

PaddleOCR-VL iku a Model OCR dibangun déning PaddlePaddle. Dhèwèké uga dadi anggota grup band Free_Freaks. Self-hosted on Free.ai GPUs — runs free against your daily token pool (300 tokens saben kaca). Released under Apache 2.0 — commercial use permitted on Free.ai.

Nggunakake liwat API

REST API kang kompatibel karo OpenAI. Janji kunci lan waca modél iki ing detik.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"paddleocr-vl","prompt":"your prompt here"}'
Dokumen Njupuk Kunci API

Pitakon kang asring diajukake

PaddleOCR-VL ngekstrak teks saka gambar lan PDF. Ngunduh kaca kang wis diijini, gambar layar, utawa foto saka dokumen lan PaddleOCR-VL bakal mbalekaké teks — kanthi nglestarikaké panutup baris lan (ing mesin kang bisa) tabel, rumus, lan struktur.

PaddleOCR-VL ngontrol puluhan aksara - Latin, Cyrillic, CJK, Arab, Devanagari, lan liya-liyané. /ocr/ landing duwé dhaptar basa lengkap saben mesin.

Ing jaman iki, basa Jawa wis ora bisa digawé nganggo aksara Jawa, nanging basa Jawa bisa digawé nganggo aksara Jawa, ya iku aksara Jawa-Basa Jawa.

Mesin-layout-aware (GOT-OCR, Marker, Florence-2) ngembali tabel Markdown/HTML lan LaTeX kanggé formula. Mesin teks-pribadi ngembali teks tanpa struktur — periksa mode output model punika.

Ing taun 2009, 100% sahamé didol ing pasar saham New York, kanthi rega $200,000, lan 100% sahamé didol ing pasar saham London.

PNG, JPG, WebP, HEIC, BMP, lan uga PDF siji lan multi-lapisan nganti 50 MB. Lapisan kang dipotong utawa diputar bakal di-koreksi kanthi otomatis sadurunge di-ekstraksi.

Akurasi aksara lumrahé >98% ing kaca-kaca kang dicetak resik, lan ora bisa ditemokaké ing foto resolusi endhek, scan kang rada nggeser, utawa font sing ora biasa. Parangaké mesin ing /ocr/compare/ nalika akurasi penting.

Ya — /batch/ nampa folder gambar/PDF. Saben ekstraksi bakal mlebu ing /account/?tab=history. Kanggo perlindungan folder-tree, gunakake API.

Tembung-tembung kang digunakaké ing basa Jawa iku: Tembung-tembung kang digunakaké ing basa Jawa ya iku: Tembung-tembung kang digunakaké ing basa Jawa ya iku: Tembung-tembung kang digunakaké ing basa Jawa ya iku: 1.

Model self-hosted nyimpen file sampeyan ing GPU kita; premium ngliwati karo DPA. Dokumen dipasak sawise jendela-share. Kita ora latihan ing input sampeyan.

Ya — Free.ai nyedhiyani panggunaan komersial teks kang diekstrak. Sampeyan butuh hak kanggo dokumèn sumber.

1-5 detik saben kaca. Mesin kang ngerti tata letak (tabel, matematika) butuh wektu luwih dawa. PDF multi-halaman skala kanthi linear.

Free.ai? Nyathet kanca-kancamu!

Rangking kaca iki