Назад до блогу

Імпорт каталогу і якість даних: валідація, дедуп, нормалізація і “погані” фіди

Як приймати дані в каталог: CSV/XML/JSON фіди, правила валідації, дедуплікація, нормалізація атрибутів, звіти для постачальників і контроль якості без ручної роботи.

16 трав. 2026 р.

Каталог ламається не в UI, а в даних

Найчастіша проблема контент‑платформ — “сміття” у фідах: дублікати, різні формати атрибутів, порожні поля. Якщо не мати пайплайну якості, доведеться “чистити руками” і втрачати час.

1) Пайплайн імпорту

  • Staging → validation → mapping → publish.
  • Версії імпорту: щоб можна було відкотити.

2) Валідація

  • Обов’язкові поля, типи, діапазони, формати.
  • Залежності: якщо є "розмір", то потрібна "сітка розмірів".

3) Дедуп і matching

Ключі: sku, gtin, vendorCode. Для “майже однакових” — fuzzy matching з ручним підтвердженням.

4) Звіти і зворотний зв’язок

Постачальнику потрібен репорт: які рядки відхилені і чому. Це зменшує повторні помилки й підтримку.

Підсумок

Якість каталогу — це інженерний процес: пайплайн імпорту, валідація, дедуп і зрозумілі звіти. Так платформа масштабується без ручної “санітарії”.

Релевантні статті