Документация
Всё, что нужно знать, чтобы начать собирать данные с любого сайта
Быстрый старт
Чтобы настроить сбор данных, понадобится всего 4 шага. Весь процесс занимает пару минут и не требует написания кода.
Шаг 1. Укажите сайт
Вставьте ссылку на каталог или любую страницу со списком интересующих объектов — товаров, вакансий, объявлений, статей. Extracto автоматически определит тип источника.
Шаг 2. Выберите категории
ИИ проанализирует структуру сайта и покажет доступные категории. Отметьте нужные или выберите «Собираем все», чтобы обработать всё сразу.
Шаг 3. Добавьте пример товара
Откройте один из объектов и скопируйте его URL. Это позволит парсеру понять, какие поля есть на странице-образце и как их извлекать.
Шаг 4. Настройте поля
Укажите, какие поля собирать: название, цену, рейтинг, описание, характеристики. Extracto заполнит первый пример автоматически, а вы можете добавить или убрать нужные поля.
Оплата и пополнение баланса
Extracto работает по модели пополнения внутреннего баланса. Вы пополняете счёт на любую сумму (от 100 ₽), а затем платите за каждую задачу парсинга — стоимость рассчитывается автоматически AI-анализом сайта.
Способы оплаты
- Банковская карта (Visa, Mastercard, МИР) — через ЮKassa
- СБП — Система быстрых платежей
- Криптовалюта — USDT, BTC, ETH, TON и ещё 30+ через Heleket
Как вы получите результат после оплаты
Процесс одинаково прост для всех типов сайтов:
1. Подтверждение задачи
После настройки полей Extracto покажет расчёт стоимости парсинга. Вы подтверждаете сумму — она списывается с баланса, и задача ставится в очередь.
2. Запуск парсинга
Задача запускается автоматически в течение до 2 часов с момента подтверждения. Статус можно отслеживать в личном кабинете в разделе «Мои источники».
3. Уведомление о готовности
Как только парсинг завершён, вам приходит письмо на email с ссылкой на результат. Одновременно в личном кабинете обновляется статус на «Готово».
4. Скачивание результата
Результат доступен для скачивания прямо из личного кабинета в трёх форматах (см. ниже). Файл хранится минимум 30 дней, после чего удаляется.
Сроки выполнения
- Простой сайт — от 1 до 6 часов
- Средний сайт — от 6 до 48 часов
- Сложный сайт — от 1 до 7 суток
Точный срок зависит от объёма данных и загруженности очереди. При превышении обычных сроков мы уведомим вас по email.
Форматы экспорта
Готовые данные можно скачать в любом удобном виде:
- CSV — для Excel, Google Sheets, Airtable
- JSON — для API-интеграций и разработчиков
- XLSX — готовая таблица с форматированием
Сложность сайтов
Стоимость рассчитывается исходя из сложности парсинга. Мы делим сайты на три категории:
Простой сайт — от 1 500 ₽
- Статические страницы без JavaScript
- До 1 000 страниц
- Без авторизации
- Стандартная структура данных
Средний сайт — от 5 000 ₽
- JS-рендеринг (React, Vue, Angular)
- До 10 000 страниц
- Пагинация или бесконечная прокрутка
- Вложенная структура данных
Сложный сайт — от 10 000 ₽
- Требуется авторизация пользователя (личный кабинет клиента)
- Динамическая подгрузка данных через AJAX
- Нестандартная структура страниц
- Большие объёмы данных и сложные цепочки переходов
Ограничения
Мы не извлекаем данные с сайтов, где это запрещено их robots.txt или условиями использования. Также мы не собираем персональные данные третьих лиц без правовых оснований. Подробности — в Условиях использования.
Нужна помощь?
Если что-то непонятно или ваш случай нестандартный — напишите нам, и мы поможем настроить сбор под вашу задачу.
- Telegram: @extracto_ru_bot
- Email: support@extracto.ru