arXiv PDF استخراج

الاستخدام التجاري 380+ طراز لا يوجد علامة مائية لا حاجة للتسجيل
النموذج:
+ GPT-5, Claude, Gemini
ضع في arXiv نسخة مسبقة من الطبعة، ورقة مجلة، أو فصل أطروحة - الذكاء الاصطناعي يحولها إلى نص نظيف مع رائحة لاتك. تظل المعادلات الرياضية كمعادلات، وتوضع التصميمات متعددة الأعمدة، وتحفظ الاقتباسات.

ضع ورقة بحثية في شكل PDF هنا أو انقر لتحميلها

PDF حتى 50 ميغابايت. ~300 رمز في الصفحة (الرياضيات).

قراءة المعادلات + فك لف الأعمدة...
الخيارات المتقدمة
النتيجة
تريد نتائج أفضل؟ نماذج عالية الجودة (GPT-5, Claude, Gemini) توفر جودة أعلى. عرض الخطط

❤️ Love this tool? Share it!

انضم للحصول على رابط إحالتك وكسب 25,000 رمز لكل صديق.

تريد المزيد؟ انضم مجانا ل 30K الرموز/يوم + 10K مكافأة
انضم مجانا

... معالجة طلبك

ضع نسخة مسبقة من arXiv، احصل على نص نظيف برائحة LaTeX مع كل معادلة تعرض في السطر.

كيف تستخدم arXiv PDF استخراج

1
أدخل مدخلك

أدخل نص، أو تحميل ملف، أو وصف ما تريد. لا حساب مطلوب.

2
انقر على إنشاء

الذكاء الاصطناعي لدينا يعالج طلبك في ثوان باستخدام أفضل نماذج المصدر المفتوح.

3
تنزيل وتقاسم

تحميل، نسخ، أو مشاركة نتائجك مجانا للاستخدام الشخصي والتجاري.

استخدام هذه الأداة عن طريق API

أتمتة هذه الأداة من شفرة الخاصة بك. OpenAI-متوافق REST نقطة نهاية، حامل-رمز التوثيق، لا يلزم إضافي SDK. تكاليف الرموز تطابق واجهة شبكة الويب.

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the arXiv PDF استخراج tool on: ..."}]}'

arXiv PDF استخراج — FAQ

ضع نسخة من arXiv و يحول الذكاء الاصطناعي الورقة بأكملها إلى نص نظيف برائحة LaTeX المعادلات تعود كـ LaTeX صحيحة، تخطيط الأعمدة المتعددة غير مكتمل، المراجع سليمة.

كان مجمع التدريب لـ نوغات هو arXiv preprints - لذا فهو يلمع تماماً على عائلة IEEE / ACM / NeurIPS / ICML / arXiv. وغيرها من برامج استخراج PDF تخنق على الرياضيات متعددة الأعمدة؛ وقد صُممت هذه البرامج لهذا الغرض.

تحميل الوثيقة PDF من arXiv (مثل arxiv.org/pdf/2401.12345)، وتحميلها هنا، والحصول على ملف واحد.txt مع الورقة الكاملة كنص معطر بلغة LaTeX. لا يلزم أي مفتاح API arXiv؛ نحتاج فقط إلى الوثيقة PDF.

نعم — هذه هي خاصية العناوين الرئيسية. الرياضيات المضمنة هي `$...$`، والرياضيات المعروضة هي `$$...$$`. حتى المعادلات المصوغة في ورقات قديمة تمر بشكل صحيح لأن النموذج يعامل كل صفحة كصورة.

المعالجة التلقائية. نمط IEEE ذو العمودين هو أكثر التصميمات شيوعاً في arXiv و Nougat يقوم بفك لفها إلى ترتيب قراءة صحيح دون علامة تكوين.

نعم - تبقى العلامات `[12]`/`[Smith2020]` في مكانها، وتستخلص قائمة المراجع الكاملة في النهاية سليمة لاستخدامها في مرحلة ما بعد BibTeX/Zotero.

~ 8-15 ثانية/صفحة. ورقة مؤتمر من 12 صفحة تستغرق ~ 2-3 دقائق. ورقات على غرار NeurIPS من 30 صفحة أو أكثر مع التذييلات: 8-12 دقيقة.

300 رمز/صفحة، الطابق 600. معظم ورقات المؤتمرات في arXiv (8-15 صفحة) هي 2400-4500 رمز. تغطي المجموعة المجانية اليومية ~ 1-2 ورقة/يوم للمستخدمين المسجلين؛ الخطط المدفوعة لا تحدد.

تغذيه إلى ChatGPT / Claude لـ "شرح هذه الورقة"، بناء RAG الشخصي على ورقاتك المحفوظة، البحث الدلالي في قائمة القراءة، نسخ المعادلات إلى مشروع لاتك الخاص بك، أو قراءة الورقة كنص بسيط على هاتفك.

نعم - نوغات OCR داخليا. arXiv تم عرض LaTeX لأكثر من 25 عاما لذلك معظم preprints نظيفة رقمية. الأوراق المسح الأقدم تعمل ولكن الدقة الرياضية تنخفض قليلا؛ إعادة المسح بأكثر من 300 DPI لتحقيق أفضل النتائج.

يتم حذف ملفات PDF بعد استخراجها مباشرة. يتم الاحتفاظ بمخرجات LaTeX لمدة 24 ساعة (غير معروفة) / 7 أيام (وصلة مشاركة مدفوعة). لا تستخدم أبدا للتدريب.

نعم - POST `file` متعدد الأجزاء إلى /v1/document/academic-pdf/. JSON response with `text_url`, `pages`, `preview`, `tokens`, `share_url`. bearer auth (sk-free-…) gives 10K free tokens/month. /api/ for curl example.

تسجيل مجاني ل 30000 رموز

إنشاء حساب مجاني

لا تلزم بطاقة ائتمان

كيف تقيِّم هذه الأداة؟

Love this tool? Share it!