Парсинг сайтов (для всех)
⚓ Work 📅 2026-02-10 👤 surdeus 👁️ 1
Файлы с результатом парсинга нужно получить в валидном json, структура с описанием и примером в файле «Описание полей товаров.json»
Для каждого товара обязательными полями являются: id,name,article,brand,images,measure_unit,params,krat,dimensions (без volume),category,url.
Без одного из этих полей информация о товаре считается не пригодной.
Если вы одновременно получаете информацию из нескольких источников, тогда на вас ложится вопрос обработки дублей.
Список источников парсинга будет отсортирован по приоритету данных. Тоесть после получения данных с первого источника , дублированные товары из второго источника получать не нужно. Дубли — товары которые имеют одинаковые значения бренда и артикула. Логично предположить что бренды нужно будет тоже сопоставить, чтобы логические дубли отфильтровывались и не попадали в результат парсинга. Логически это один и тот же бренд, и товары этих брендов должны быть проверены на дубли по артикулу.
На проверку результатов парсинга потребуется около 5-7 дней, проверка будет проводиться скриптами.
По окончанию работы, возможна работа на постоянной основе.
Сайты напишем по окончанию выбора работника
🏷️ Work_feed
