PaddleOCR-VL

Free.ai (self-hosted) · ocr · ~300 Μάρκες ανά page

Ρίξτε ένα αρχείο εδώ ή κάντε κλικ για να περιηγηθείτε

~300 Μάρκες ανά page

PaddleOCR-VL is a Μοντέλο OCR built by PaddlePaddle. Πιο δυνατά στο Fast multilingual image / scan to Markdown; tables, formulas, charts; 109 languages.. Αυτό-φιλοξενούνται σε Free.ai GPUs ~ τρέχει δωρεάν ενάντια σας καθημερινή πισίνα μάρκα (300 μάρκες ανά σελίδα). Κυκλοφόρησε κάτω από Apache 2.0 __] εμπορική χρήση επιτρέπεται στις Free.ai.

Χρήση μέσω API

OpenAI συμβατό REST API. Δημιουργήστε ένα κλειδί και καλέστε αυτό το μοντέλο σε δευτερόλεπτα.

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"paddleocr-vl","prompt":"your prompt here"}'
Τεκμηρίωση API Πάρτε το κλειδί API

Συχνές Ερωτήσεις

PaddleOCR-VL απόσπασμα κειμένου από εικόνες και PDFs. Ανεβάστε μια σαρωμένη σελίδα, ένα στιγμιότυπο οθόνης, ή μια φωτογραφία ενός εγγράφου και PaddleOCR-VL επιστρέφει το κείμενο Διακόπτει τη γραμμή συντήρησης και (σε ικανούς κινητήρες) πίνακες, τύπους και δομή.

PaddleOCR-VL hands things of scripts Latin, CjK, Arabic, Devanagari, and more. Η /ocr/ προσγειώνεται έχει την πλήρη λίστα γλωσσών ανά κινητήρα.

Ναι για καθαρό έντυπο-στυλ γραφικό χαρακτήρα; cursive και κοντόχερα είναι σκληρότερα. TrOCR και σύγχρονες μετασχηματιστές-based κινητήρες είναι αισθητά καλύτερα από την κληρονομιά Tesseract για το γραφικό χαρακτήρα.

Οι κινητήρες ρύθμισης (GOT-OCR, Marker, Florence-2) επιστρέφουν τους πίνακες Markdown/HTML και LaTeX για τύπους.

PaddleOCR-VL τρέχει σε GPUs μας από την καθημερινή δωρεάν πισίνα σας? $ 5 → 200.000 πληρωμένα μάρκες μετά. ~300 μάρκες ανά σελίδα.

PNG, JPG, WebP, HEIC, BMP, συν μονοσέλιδα και πολυσέλιδα PDF μέχρι 50 MB. Οι σελίδες Skinwed ή περιστρεφόμενες διορθώνονται αυτόματα πριν από την εξαγωγή.

Ακρίβεια χαρακτήρων είναι συνήθως > 98% σε καθαρές τυπωμένες σελίδες, ρίχνοντας σε φωτογραφίες χαμηλών res, σοβαρά σαρωμένες σαρώσεις, ή ασυνήθιστες γραμματοσειρές. Συγκρίνετε τους κινητήρες σε / ocr/compare/ όταν η ακρίβεια έχει σημασία.

Κάθε εξαγωγή προσγειώνεται στο /λογαριασμό/?tab=ιστορία. Για τη διατήρηση του φακέλου-δέντρου χρησιμοποιήστε το API.

Ναι, το αρχείο σας στο /v1/ocr/ με το μοντέλο="PaddleOCR-VL". Επιστρέφει το JSON με κείμενο + (όταν υποστηρίζεται) διάταξη + κιβώτια σύνδεσης επιπέδου λέξεων. /api/ έχει την πλήρη αναφορά.

Τα αυτο-φιλοξενούμενα μοντέλα διατηρούν το αρχείο σας στις GPUs μας; premium περνούν μέσα με ένα DPA. Τα έγγραφα διαγράφονται μετά το παράθυρο μετοχών. Δεν εκπαιδεύουμε στις εισόδους σας.

Ναι.. Free.ai χορηγεί εμπορική χρήση του εξαγόμενου κειμένου. Χρειάζεστε δικαιώματα στο έγγραφο πηγής.

Οι μηχανές layout-aware (τραπέζια, μαθηματικά) παίρνουν περισσότερο χρόνο. πολυσέλιδο PDFs κλίμακα περίπου γραμμικά.

Love this tool? Share it!

Βαθμολογήστε αυτή τη σελίδα