PaddleOCR-VL

Free.ai (self-hosted) · ocr · ~300 װײַז page

לאָז אַ טעקע אױף

~300 װײַז page

PaddleOCR-VL איז an OCR מאָדעל געבויט דורך PaddlePaddle דער װײַטער װײַטער איז דער װײַטער. Free.ai GPUs — לויפט פריי קעגן דיין טעגלעך טיקען פּאָול (300 טיקען בלעטער). דער אָריגינעלער טעקסט פֿון דער װײַטער־פֿאַרבינדונג איז װייטער צו געפֿינען אונטער Free.ai.

ניצן דורך API

OpenAI־צוגעפֿאַלענע REST API. שאַפֿן אַ קלײַב און װײַז דאָס מודל אין סעקונדעס

curl -X POST https://api.free.ai/v1/ocr/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model":"paddleocr-vl","prompt":"your prompt here"}'
API דאָקומענטאַציע אַרײַנשטעלן API־שריפֿטצײכן

װײַז מאָדע

פֿראַגעס

PaddleOCR-VL אַרײַנשרײַבט טעקסט פֿון בילדער און PDFס. אַרײַנשרײַבן אַ סקאַנירטע בלעטערער, אַ בילדצעלן אָדער אַ בילד פֿון אַ דאָקומענט און PaddleOCR-VL גיט צוריק דעם טעקסט — אַרײַנשרײַבנדיק שורות און (אויף װאָס קענען) טאַבעלע, פֿאָרמולעס און סטרוקטור

PaddleOCR-VL האַנדלט זיך מיט טויזנטער שריפֿטן — לאַטיניש, קיריליש, CJK, אראבער, דװאַנאַגאַרי, און מער. דער /ocr/ לאַנדינג בלעטערער האָט די גאַנץ שפּראַך־ליסט פֿאַר יעדער אָפּעראַציע.

יָא פֿאַר אַ קלאָרע דרוק־סטייל האַנטשריפֿט; קורסיװ און פֿאַרקירצטע האַנטשריפֿט זײַנען שווערער. TrOCR און מאָדערנע טראַנספֿאָרמירונג־באזירטע מאַניאַפאַקטשערער זײַנען קלאָר בעסער ווי דער אַלט־טעסעראַקט פֿאַר האַנטשריפֿט

שריפֿט־פֿאַרבינדענע װײַזער (GOT-OCR, Marker, Florence-2) װײַזן צוריק Markdown/HTML טאַבעלע און LaTeX פֿאַר פֿאָרמולעס. פּשוטע־טעקסט װײַזער װײַזן צוריק טעקסט אָן סטרוקטור — באַשטעטיקן דעם מודל ס׳ס װײַזער־מאָדע

PaddleOCR-VL לויפט אויף אונזערע GPUס פון אייער טעגלעכער פרייער פּאָול; $5 → 200,000 באצאלטע טיקעטן דערנאָך. ~300 טיקעטן פּער בלאט.

PNG, JPG, WebP, HEIC, BMP, און אײנער־ און מער־סײַטן PDFס ביז 50 מײַל. װידערגעװײנטלעכע אָדער װידערגעװײנטלעכע זײַטן ווערן אויטאָמאַטיש פֿאַרקערט איידער דער אַרײַנשרײַבונג

שריפֿטצײכן־פּרופֿטלעכקייט איז בפֿרט >98% אויף קלײנע אױסגעדרוקטע בלעטער, װי אויך אױף נידעריק־פֿאָרשטעלונג פֿאָטאָגראַפֿיעס, װי אויך װידערגעפֿילטע סקענז, אָדער אומבאַקאַנטע שריפֿטן. פֿאַרגליכן די װײַזער־מאַשינען אויף /ocr/compare/ װען פּרופֿטלעכקייט איז וויכטיק

יָא — /batch/ לאָזט זיך אַ פּאַפּקע פֿון בילדער/PDFס. יעדער עקסטראַקציע לאַנדט אין /account/?tab=history. פֿאַר פּאַפּקע־בױם־באַהאַלט ניצט די API

יָא — פּאָסטן די טעקע צו /v1/ocr/ מיט מאָדעל="PaddleOCR-VL". גיט צוריק JSON מיט טעקסט + (װען שטיצט) אויסלייג + וואָרט־בײדע באַגרענעצונג־קעסטלען. /api/ האָט די פֿולע רעפֿערענץ

זיך־געהאַלטענע מאָדעלן היטן די טעקע אויף אונדזערע GPUס; פּרעמיום לאָזט זיך דורכגיין מיט אַ DPA. דאָקומענטן ווערן אויסגעמעקט נאָך דעם טייל־פֿענצטער. מיר לערנען זיך ניט פֿון דיין אַרײַנשרײַב

יָה — Free.ai גיט אַ קאָממערציעלע ניצע פֿון דער עקסטראַקטירטער טעקסט. דו דאַרפֿסט רעכטן צום מקור־דאָקумент

1–5 סעקונדעס אױף אַ בלעטער. פֿאַרגרעסער־פֿאַרבינדענע מכשירים (טאַבלאַץ, מאַטאַמאַטישע) נעמען מער צײַט. אױף מערע בלעטער PDFס װעלן װײַטער

ליבע Free.ai? זאָגן דיין פריינט

קלײַב אַלץ אױס