ပညာရေးစာရွက် Extractor

စီးပွားရေးလုပ်ငန်းအသုံးပြုမှု OK ကို 380+ မော်ဒယ်များ အမှတ်အသားမရှိ မှတ်ပုံတင်ရန်မလိုပါ
မော်ဒယ် -
+ GPT-5, Claude, Gemini
arXiv preprint ကို Drop, ဂျာနယ်စာရွက်, သို့မဟုတ်ဒီဇိုင်းအခန်း - AI ကသန့်ရှင်းသော LaTeX-အရသာစာသားသို့ပြောင်းလဲ. သင်္ချာညီမျှခြင်းများညီမျှခြင်းများအဖြစ်နေထိုင်, multi-ကော်လံ layouts တွေကို unwound ရ, ဖော်ပြချက်ထိန်းသိမ်းထား.

ဒီမှာသုတေသနစာတမ်း PDF ကို Drop သို့မဟုတ် upload လုပ်ရန်နှိပ်ပါ

PDF ကိုအထိ 50 MB. ~300 စာမျက်နှာတစ်မျက်နှာလျှင် tokens (သင်္ချာ-အသိ).

ညီမျှခြင်းများဖတ်ရှု + unwinding ကော်လံများ... ~10 sec / စာမျက်နှာ
အဆင့်မြင့် ရွေးချယ်စရာများ
ရလဒ်
တန်ကိန်းများ နည်းပါးနေသည် တန်ဖိုးများ ထပ်မံရယူပါ
ပိုကောင်းတဲ့ရလဒ်တွေလိုလား? ပရီမီယံမော်ဒယ်များ (GPT-5, Claude, Gemini) အရည်အသွေးမြင့်မားပေးပို့။ စီမံကိန်းများကိုကြည့်ရန်

❤️ ချစ်ခြင်းမေတ္တာ Free.ai? သင့်မိတ်ဆွေများကိုပြောပါ!

မှတ်ပုံတင် ရန်တစ်ဦးအကြံပြုချက်ကို link ကိုရယူပြီးအနိုင်ရ 25,000 မိတ်ဆွေတစ်ဦးချင်းစီကိုတန်ဖိုးများ.

ပိုလိုလား? 30K tokens / တစ်နေ့ + 10K ဆုကြေးငွေများအတွက်အခမဲ့မှတ်ပုံတင်
Sign Up Free

သင့်တောင်းဆိုချက်ကို စီမံနေသည်...

arXiv စာရွက်များမှထွက်စာသား + ညီမျှခြင်းဆွဲ, ဂျာနယ်များ, နှင့် theses. သင်္ချာညီမျှခြင်း LaTeX သို့ပြောင်းကြသည်, multi-ကော်လံ layouts တွေကို unwound နေကြသည်, အဆိုပြုချက်များထိန်းသိမ်းထားကြသည်. Meta Nougat အားဖြင့် Powered. အခမဲ့, မှတ်ပုံတင်ခြင်းမရှိပါ.

အသုံးပြုပုံ ပညာရေးစာရွက် Extractor

1
သင့်ရဲ့ သွင်းယူမှုကို ထည့်သွင်းပါ

စာသားကိုရိုက်ထည့်ပါ၊ ဖိုင်တစ်ခုကိုတင်ပါ၊ သို့မဟုတ် သင်လိုချင်တာကိုဖော်ပြပါ။ အကောင့်လိုအပ်ချက်မရှိပါ။

2
ထုတ်လုပ်ရန်နှိပ်ပါ

ကျွန်ုပ်တို့၏ AI အကောင်းဆုံး open-source ပုံစံများကိုအသုံးပြုပြီးစက္ကန့်အနည်းငယ်အတွင်းသင့်ရဲ့တောင်းဆိုမှုကိုစီမံခန့်ခွဲသည်။

3
ဒေါင်းလုပ်လုပ်ပြီး မျှဝေပါ

Download, copy, သို့မဟုတ်သင်၏ရလဒ်ကိုမျှဝေ. ကိုယ်ရေးကိုယ်တာနှင့်စီးပွားရေးလုပ်ငန်းအသုံးပြုမှုများအတွက်အခမဲ့.

API မှတဆင့်ဤ tool ကိုအသုံးပြုပါ

သင့်ရဲ့ကိုယ်ပိုင် code ကိုမှဤ tool ကိုအလိုအလျောက်. OpenAI-ကိုက်ညီ REST endpoint, Bearer-token auth, လိုအပ်သောအပို SDK ကိုမရှိ.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the ပညာရေးစာရွက် Extractor tool on: ..."}]}'

ပညာရေးစာရွက် Extractor — FAQ

မည်သည့်ပညာရေး / သုတေသနစာရွက် PDF ကို drop - arXiv preprint, အစည်းအဝေးစာရွက်, ဂျာနယ်ဆောင်းပါး, ဆောင်းပါးအခန်း - နှင့် AI ကသန့်ရှင်းသော LaTeX-formatted စာသားသို့ပြောင်းလဲ. သင်္ချာညီမျှခြင်းများမှန်ကန်သော LaTeX အဖြစ်မှတဆင့်လာ, multi-ကျောက်တန်း layouts ဖတ်ရှုခြင်းအစဉ်အလာထဲသို့ unwound နေကြတယ်, နှင့်အကြံပြုချက် + ရည်ညွှန်းစာရင်းများထိန်းသိမ်းထားကြသည်။ ထူထပ်သောသိပ္ပံဆိုင်ရာစာရွက်စာတမ်းများ pdftotext mangles ၏အမျိုးအစားများအတွက်အထူးတည်ဆောက်.

Meta ၏ Nougat-base — arXiv စာမျက်နှာ သန်းပေါင်းများစွာတွင် လေ့ကျင့်ထားသော မြင်ကွင်း-encoder-decoder ပုံစံ။ ၎င်းသည် PDF စာမျက်နှာတစ်ခုစီကို ရုပ်ပုံတစ်ခုအဖြစ် ပြုမူပြီး Markdown + LaTeX ဖွဲ့စည်းပုံထုတ်လုပ်မှုဖြစ်သည်၊ ထို့ကြောင့် PDF တွင် raster glyphs အဖြစ် ထုတ်လုပ်ထားသည့်အခါတွင်ပင် ညီမျှခြင်းများမှန်ကန်စွာ ထွက်ပေါ်လာသည်။

အဆိုပါ Docling tool ကို (Markdown ကို PDF ကို) IBM က Granite-Docling ကိုအသုံးပြုသည် - မြန်, layout ကို-သတိပြုမိ, သဘောတူညီချက်, အစီရင်ခံစာများ, လက်စွဲစာအုပ်ကဲ့သို့သောယေဘုယျစီးပွားရေးလုပ်ငန်းစာရွက်စာတမ်းများအတွက် optimized ။ Nougat သည်အနှေးဖြစ်သော်လည်းသင်္ချာ + multi-ကော်လံသိပ္ပံနည်းကျ layouts များပေါ်တွင်တိကျစွာလေ့ကျင့်ခဲ့သောကြောင့်ပညာရေးဆိုင်ရာစာရွက်စာတမ်းများအပေါ် FAR ပိုကောင်းသည်။ စီးပွားရေးလုပ်ငန်းစာရွက်စာတမ်းများများအတွက် Docling ကိုအသုံးပြုပါ၊ သုတေသနအတွက် Nougat ။

ဟုတ်ကဲ့ — ဒါကသတ်သမား feature ကို. Inline သင်္ချာအဖြစ်ပြန်လာ `$... $`, အဖြစ်ပြသညီမျှခြင်းများ `$$... $$`. ဒါဟာ arXiv တင်သွင်းမှုနှင့်အဟောင်းစာရွက်များမှ scanned raster ညီမျှခြင်းများမှ LaTeX-rendered ညီမျှခြင်းများနှစ်ခုလုံးဖတ်နိုင်. အရည်အသွေးစာရွက်များအများစုအတွက်ထုတ်ဝေ-အဆင့်ဖြစ်ပါသည်.

ဟုတ်ကဲ့ — Nougat အလိုအလျောက်မှန်ကန်ဖတ်ရှုအစဉ်အလာထဲသို့နှစ်-ကော်လံ / သုံး-ကော်လံ layouts unwinds. ထပ်ပိုမိုစာသားကော်လံများအကြားအလယ်-ဝါကျ jumping မရှိ. ခြေရာခံမှတ်စုများတစ်ဦးချင်းစီအပိုင်း၏အဆုံးမှာခြေရာခံ blocks ထဲသို့ထုတ်ယူကြသည်။

ဖော်ပြချက်အမှတ်အသားများ `[12]` / `(Smith က 2020)` inline ရပ်တည်. အဆုံးမှာအညွှန်းစာရင်းများ formatting တည်ငြိမ်နှင့်အတူထိန်းသိမ်းထားမှတဆင့်လာ, ဒါကြောင့်သင် Zotero / Mendeley / custom ကို quote parser ကိုထဲသို့ output ကို pipe နိုင်ပါတယ်.

ကျွန်တော်တို့ရဲ့ H200 အပေါ်စာမျက်နှာတစ်မျက်နှာလျှင် 8-15 စက္ကန့်အကြောင်းကို။ ရိုးရာ 10-စာမျက်နှာကွန်ဖရင့်စာရွက် ~2မိနစ်အတွင်း run သည်။ ရှည်လျားသော Survey Papers (50+ စာမျက်နှာများ) 8-12 မိနစ်ယူ - တင်သွင်းနှင့်ထွက်ခွာသွား။

300 စာမျက်နှာတစ်စာမျက်နှာကို tokens (ထပ် 600). တစ် 10-စာမျက်နှာအစည်းအဝေးစာရွက် = 3,000 tokens. တစ် 30-စာမျက်နှာဒီဇိုင်းအခန်း = 9,000 tokens. နေ့စဉ်အခမဲ့ရေကန်အများစုကအပျင်းပြေသုတေသန-ဖတ်ရှုဖုံးလွှမ်း.

ChatGPT/Claude ထဲသို့အရည်အသွေးမြင့်စာရွက် summarization အတွက် pipe, စာရွက်များ၏ corpus ကျော်ပုဂ္ဂိုလ်ရေး RAG တည်ဆောက်, semantic-ရှာဖွေရေးသင့်ရဲ့ကိုယ်ပိုင်စာကြည့်တိုက်, LaTeX စီမံကိန်းများသို့တိုက်ရိုက်ညီမျှခြင်းများကိုကူးယူ, သို့မဟုတ်သင့်ရဲ့ဖုန်းပေါ်မှာရိုးရှင်းတဲ့စာသားအဖြစ်စာရွက်ကိုဖတ်ပါ။

ဟုတ်ကဲ့ — Nougat ၏ကိုယ်ပိုင် OCR အဆင့်လုပ်. Born-ဒစ်ဂျစ်တယ် arXiv တင်သွင်းမှုအကောင်းဆုံးဖြစ်ကြသည် (သန့်ရှင်းသပ်ရပ်သောညီမျှခြင်း rendering); scanned အဟောင်းစာရွက်များအလုပ်လည်းပေမယ့်သင်္ချာယုံကြည်မှုအနည်းငယ် drop. scans အပေါ်အကောင်းဆုံးသင်္ချာရလဒ်များအတွက်, rescan at 300+ DPI before uploading.

ချက်ချင်းစီမံခန့်ခွဲ, LaTeX စာသား output ကိုထိန်းသိမ်းထားသည် (24h အမည်မဲ့ / 7d ပေးဆောင် share-link ကိုသက်တမ်းကုန်ဆုံး), ထုတ်ယူပြီးနောက်အရင်းအမြစ် PDF ကိုမှန်ကန်စွာဖျက်ပစ်သည်. လေ့ကျင့်ရေးအတွက်မသုံးပါ. / privacy / အပြည့်အဝမူဝါဒအတွက်.

ဟုတ်ကဲ့ — POST ကို multipart `file ကို` / v1 / စာရွက်စာတမ်း / အထက်တန်းကျောင်း-pdf /. Returns {text_url, စာမျက်နှာများ, preview, tokens, share_url}. ဆောင်သူ auth (SK-အခမဲ့-...) 10K အခမဲ့ tokens / လပေး. / api / curl ဥပမာရှိပါတယ်.

30,000 tokens များအတွက်အခမဲ့မှတ်ပုံတင်

အခမဲ့အကောင့်ကိုဖန်တီး

လိုအပ်သောကဒ်မရှိ

သင်ဤ tool ကိုဘယ်လိုသတ်မှတ်မလဲ?

ချစ်ခြင်းမေတ္တာ Free.ai? သင့်မိတ်ဆွေများကိုပြောပါ!