PDF до Markdown Видобування PDF PDF до тексту Дослідити текст паперу Інструмент видобування PDF arXiv Більше →

Видобування паперу Academic

Комерційне використання Гаразд 380+ Моделі Без водяного знаку Підписування не потрібне

Скиньте арксівське препри, журнальне видання або главу " Асіда " перетворює його на чистий текст з LaTeX- flavor. Математичні рівняння залишаються у рівнянні рівнянь, розкладки з декількома стовпчиками отримують невербальні, цитати збережені. Вмикається мета- Нуґат- базою.

Витягніть текст + рівняння з паперу arXiv, журналів і цих. Математичні рівняння перетворено на LaTeX, багатоколонки розкладки не збігаються, посилання зберігаються. Задіяні мета- Ногатом. Вільно, без підписок.

Як користуватися Видобування паперу Academic

Введіть вхідні дані

Введіть текст, вивантажити файл або опишіть, що бажаєте. Не потрібен обліковий запис.

Створення клацання

Наш комп'ютер обробляє ваш запит за лічені секунди, використовуючи найкращі моделі з відкритим кодом.

Звантажити спільний ресурс

Звантажте, скопіюйте або здайте ваш результат. Вільно для особистого і комерційного використання.

Використовувати цей інструмент через API

Автоматизувати цей інструмент з вашого власного коду. Сумісна з OpenAI кінцева точка, Автентифікація- постачальника, додаткова інформація про SDK не потрібна. Ціна на ключ відповідає веб- інтерфейсу.

Документація з API Отримати ключ API

curl -X POST https://api.free.ai/v1/chat/ \
  -H "Authorization: Bearer sk-free-..." \
  -H "Content-Type: application/json" \
  -d '{"model": "qwen7b", "messages": [{"role": "user", "content": "Use the Видобування паперу Academic tool on: ..."}]}'

Пов' язані інструменти для роботи з комп' ютером

PDF до Markdown

Видобування PDF

PDF до тексту

Дослідити текст паперу

Інструмент видобування PDF arXiv

Видобування паперу Academic — FAQ

Підходьте до будь- якого наукового / дослідного документа PDF } xiv prec, конференції, статті з журналу, глави Азису ⇩ і ШІ перетворює його на чистий текст у форматі LaTeX. Математичні рівняння проходять як належне LaTeX, багатоколонки розкладки є нерівними у порядок читання, а посилання + довідкові списки зберігаються. Вбудовані спеціально для щільних наукових документів pdftotext mangles.

Meta's Nougat- base' a vision- encoder- decoder, вивчена на мільйонах сторінок arXiv. Ця модель вважає кожну сторінку PDF зображенням і вихідними даними структуровано Markdown + LaTeX, ось чому рівняння відбуваються правильно, навіть якщо їх показано у вигляді растрових гліфів у джерелі PDF.

Інструмент " Доклінг " (PDF to Markdown) використовує інструмент IBM Granite- Docling ® special, application- application, оптимізований для загальних ділових документів на зразок контрактів, звітів, довідників. Nougat повільніший, але FAR краще працює у наукових документах, оскільки його спеціально тренували для математичних та багатокольорових наукових розкладок. Для дослідження використовуйте Docling для ділових документів, Nougat.

Так, це вбивча функція. Математична математика повертає себе у вигляді " $$...$," виокремлює рівняння як $$...$$. У ній можна прочитати рівняння LaTeX- ниче рівняння з arXiv і растрових рівнянь зі старих документів. Якість - це вихідна дата для більшої частини паперу.

Так, Nougat автоматично розблоковує два- стовпчики / три стовпчики у правильному порядку читання. Більше не буде тексту, який стрибає з середини між стовпчиками. Списки розтягуються до блоків з примітками наприкінці кожного з розділів.

} [12] / } [Сміт 2020])} Залишайтеся в рядку. Згадки в кінці проходять через непошкоджене форматування, отже, ви можете спрямувати вивід до Zotero / Menderey / нетипового інструменту обробки цитування.

Приблизно 8-15 секунд на сторінку на нашу "Г200." Типовий нарадний папір триває протягом 10-2 хвилин.

300 жетонів на сторінку (floor 600). Папір з 10- сторінкової конференції = 3000 жетонів. глава 30- сторінки тезису = 9000 жетонів. Щоденний безкоштовний басейн охоплює найбільш випадкове читання.

Пересилайте його на ChatGPT _ __ для резюме паперу, збудуйте персональний RAG через корпус паперу, семант-дослідження вашої власної бібліотеки, скопіюйте рівняння безпосередньо до проектів LaTeX, або просто прочитайте папір як звичайний текст на вашому телефоні.

Так, Нуґат робить свій власний крок ОРС. Найкращим є відмінювання від ARXiv (чисте зображення рівнянь); скановані старіші папери працюють теж, але математична точність трохи падає. Найкращі математичні результати на скануванні, переканувати на 300+ т/ д перед вивантаженням.

Одразу після видобування буде збережено вивід тексту LaTeX (24h Anonymous / 7d сплати за вилучення спільного посилання), вивід PDF буде вилучено одразу після видобування. Ніколи не використовується для тренування. / crivacy / для повного правила.

Так, якщо ви бажаєте отримати доступ до multipart } = / v1/ document/ academic- pdf /. Повертає {текст_ адреса, сторінки, попередній перегляд, маркери, share_ url}. Bearer auth (sk- free -...) дає 10K вільних марок/ місячних. / api / має зразок згортки.

Вільна реєстрація на 30 000 марок

Створити вільний обліковий запис

Не потрібна кредитна картка

Як би ви оцінили цей інструмент?

Видобування паперу Academic

Результат

Як користуватися Видобування паперу Academic

Введіть вхідні дані

Створення клацання

Звантажити спільний ресурс

Використовувати цей інструмент через API

Пов' язані інструменти для роботи з комп' ютером

Видобування паперу Academic — FAQ

Що це за інструмент?

Яка модель його підтримує?

Чим відрізняється від звичайних інструментів PDF від інструменту Markdown?

Вона працює з математичними рівняннями?

Розкладки з декількома стовпчиками?

А що сказати про цитати та посилання?

Наскільки це швидко?

Скільки це коштує?

Що я можу зробити з виводом?

Чи підтримуються скановані документи?

Вивантажено PDF?

Чи існує API?

Дістати 10 000 безпосадочних тонів

Чекайте! Отримайте 10 кілків безкоштовно!

Хочеш ще?