PDF إلى Markdown مستخرج PDF تحويل PDF إلى نص ورقة بحثية إلى نص arXiv PDF استخراج أكثر →

برنامج استخراج الورقات الأكاديمية

الاستخدام التجاري 380+ طراز لا يوجد علامة مائية لا حاجة للتسجيل

ضع في arXiv نسخة مسبقة من الطبعة، ورقة مجلة، أو فصل أطروحة - الذكاء الاصطناعي يحولها إلى نص نظيف مع رائحة لاتك. تظل المعادلات الرياضية كمعادلات، وتوضع التصميمات متعددة الأعمدة، وتحفظ الاقتباسات.

سحب النص + المعادلات من arXiv ورقات، المجلات، والأطروحات. المعادلات الرياضية تحويل إلى LaTeX، تعدد الأعمدة التصميمات يتم فك، الاقتباسات يتم الحفاظ. محرك من قبل Meta Nougat. مجاني، لا تسجيل.

كيف تستخدم برنامج استخراج الورقات الأكاديمية

أدخل مدخلك

أدخل نص، أو تحميل ملف، أو وصف ما تريد. لا حساب مطلوب.

انقر على إنشاء

الذكاء الاصطناعي لدينا يعالج طلبك في ثوان باستخدام أفضل نماذج المصدر المفتوح.

تنزيل وتقاسم

تحميل، نسخ، أو مشاركة نتائجك مجانا للاستخدام الشخصي والتجاري.

استخدام هذه الأداة عن طريق API

أتمتة هذه الأداة من شفرة الخاصة بك. OpenAI-متوافق REST نقطة نهاية، حامل-رمز التوثيق، لا يلزم إضافي SDK. تكاليف الرموز تطابق واجهة شبكة الويب.

وثائق API احصل على مفتاح API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the برنامج استخراج الورقات الأكاديمية tool on: ..."}]}'

أدوات الذكاء الاصطناعي المجانية ذات الصلة

PDF إلى Markdown

مستخرج PDF

تحويل PDF إلى نص

ورقة بحثية إلى نص

arXiv PDF استخراج

برنامج استخراج الورقات الأكاديمية — FAQ

لقد تم تصميم هذا البرنامج خصيصاً لتحويل أي ورقة أكاديمية أو بحثية إلى نص PDF - أي ورقة منشورة مسبقاً في arXiv، أو ورقة مؤتمر، أو مقالة في مجلة، أو فصل في أطروحة - ويحولها الذكاء الاصطناعي إلى نص نظيف مصمم بلغة لاتك. وتظهر المعادلات الرياضية بلغة لاتك سليمة، ويتم فك ترتيب التصميمات المتعددة الأعمدة في ترتيب القراءة، ويجري الحفاظ على الإشارات + قوائم المراجع.

نوغات-باس (Nougat-base) من ميتا - نموذج رؤية-ترميز-فك التشفير مدرب على ملايين صفحات arXiv. إنه يعامل كل صفحة PDF كصورة ويخرج ماركدون + لاتكس منظمة، وهذا هو السبب في أن المعادلات تمر بشكل صحيح حتى عندما يتم عرضها كعلامات راستر في المصدر PDF.

أداة Docling (PDF to Markdown) تستخدم IBM Granite-Docling - سريع، وواضح التصميم، ومحسن لوثائق الأعمال العامة مثل العقود، والتقارير، والكتيبات. Nougat أبطأ ولكنه أفضل بكثير على الأوراق الأكاديمية لأنه تم تدريبه تحديداً على الرياضيات + التصميمات العلمية متعددة الأعمدة. استخدم Docling لوثائق الأعمال، Nougat للبحوث.

نعم — هذه هي الخاصية القاتل. الرياضيات في السطر يعود إلى `$... $`، المعادلات المعروضة على `$$... $$`. يمكن أن يقرأ كلا من معادلات LaTeX من arXiv التقديمات والمعادلات الراسترية المسح الضوئي من الأوراق القديمة. الجودة هي من مستوى النشر للغالبية العظمى من الأوراق.

نعم - يقوم نظام نوغات بفك ترتيبات الأعمدة الثلاثة/العمودين تلقائيا إلى ترتيب القراءة الصحيح. ولم يعد النص يقفز بين الأعمدة في منتصف الجملة. ويتم استخراج الحواشي إلى كتل للحواشي في نهاية كل قسم.

تبقى علامات الإشارة `[12]` / `(Smith 2020)` في السطر. قوائم المراجع في النهاية تأتي مع الحفاظ على الشكل السليم، لذلك يمكنك توجيه المخرج إلى Zotero / Mendeley / تحليل الإشارة الشخصية.

حوالي 8-15 ثانية لكل صفحة على H200. ورقة المؤتمر النموذجية من 10 صفحات تجري في ~ دقيقتين. ورقات المسح الطويلة (50 صفحة +) تستغرق 8-12 دقيقة - تقديم والسير.

300 رمز لكل صفحة (الطابق 600) ورقة مؤتمر من 10 صفحات = 000 3 رمز فصل رسالة من 30 صفحة = 000 9 رمز ويغطي المجموع اليومي المجاني معظم القراءة البحثية العرضية.

ضعها في ChatGPT/Claude لتلخيص ورقة، أو إنشاء RAG شخصي على مجموعة من الأوراق، أو البحث الدلالي في مكتبتك الخاصة، أو نسخ المعادلات مباشرة إلى مشاريع لاتك، أو مجرد قراءة الورقة كنص بسيط على هاتفك.

نعم - يقوم نوغات بعملية التعرف البصري على الحروف الخاصة به. وتقديمات arXiv الرقمية المولدة هي الأفضل (تمثيل نظيف للمعادلات)؛ وتعمل الأوراق القديمة المسحوقة أيضاً ولكن دقة الرياضيات تنخفض قليلاً. ولأفضل نتائج رياضية على المسح الضوئي، أعيد المسح الضوئي بأكثر من 300 نقطة في البوصة قبل تحميلها.

يتم معالجة النصوص على الفور، ويُحتفظ بنصوص LaTeX (24 ساعة مجهولة / 7 أيام انتهاء صلاحية المشاركة المدفوعة)، ويحذف المصدر PDF فورا بعد الاستخراج. لا يُستخدم أبدا للتدريب. /privacy/ للاطلاع على السياسة الكاملة.

نعم — POST `file` متعدد الأجزاء إلى /v1/document/academic-pdf/. يعيد {text_url, pages, preview, tokens, share_url}. حامل التوقيع (sk-free-…) يعطي 10K رموز مجانية/شهر. /api/ لديها مثال curl.

تسجيل مجاني ل 30000 رموز

إنشاء حساب مجاني

لا تلزم بطاقة ائتمان

كيف تقيِّم هذه الأداة؟

برنامج استخراج الورقات الأكاديمية

النتيجة

كيف تستخدم برنامج استخراج الورقات الأكاديمية

أدخل مدخلك

انقر على إنشاء

تنزيل وتقاسم

استخدام هذه الأداة عن طريق API

أدوات الذكاء الاصطناعي المجانية ذات الصلة

برنامج استخراج الورقات الأكاديمية — FAQ

ما هي برنامج استخراج الورقات الأكاديمية؟

أي نموذج يقودها؟

كيف يختلف هذا عن أداة الـ PDF إلى Markdown العادية؟

هل يتعامل مع معادلات الرياضيات؟

أشكال متعددة الأعمدة؟

ماذا عن الاقتباسات والمراجع؟

كم هو سريع؟

كم تكلف؟

ماذا يمكنني أن أفعل بالنواتج؟

هل تدعم الورقات المسحوبة؟

هل تخزن ملفات PDF المحملة؟

هل هناك اختبار دقيق؟

حصل على 10,000 رموز مجانية

انتظر - احصل على 10K رموز مجانية!

تريد المزيد؟