#2. Predikce v praxi: Projekt 1

Predikce v praxi

Projekt 1

promo akce a sezónnost

Jedním z klíčových faktorů, který se v praxi opakovaně ukazuje jako rozhodující, je délka dostupné historie. Právě ta často určuje, zda model dokáže zachytit trend a sezónnost, nebo zda se jeho predikce rozpadá. Tento problém je zásadní zejména v prostředí, kde se produktové portfolio neustále mění a nové položky vznikají bez dostatečné historie.

Pro lepší pochopení tohoto problému se podívám na konkrétní dataset, který dobře reprezentuje typický retailový scénář. Je na něm velmi dobře vidět, jak rozdílná délka historie napříč produkty ovlivňuje chování jednotlivých modelů.

Dataset obsahuje měsíční prodeje pro přibližně 15 000 produktů za období 4 let. Na první pohled působí dataset relativně jednoduše. Při detailnějším pohledu se ale ukazuje výrazná variabilita mezi jednotlivými produkty – zejména v délce historie a stabilitě prodejů.

část zboží má kratší historii
některé produkty mají stabilní prodeje každý měsíc
jiné jsou silně sezónní
část se prodává nepravidelně

Rozdíly jsou patrné i v objemech:

běžné produkty se pohybují v řádu desítek kusů měsíčně
u některých položek dochází k nárazovým prodejům v řádu stovek až tisíců kusů

Základní charakteristika datasetu je shrnutá v následující tabulce:

Parametr	Hodnota
Počet produktů	15 000
Frekvence dat	měsíční
Nejdelší historie	48 měsíců
Nejkratší historie	1 měsíc
Podíl období 1 - 6 měsíců	2.7%
Podíl období 7 - 12 měsíců	4.6%
Podíl období 13 - 24 měsíců	6.6%
Podíl období 24+ měsíců	86.1%
Průměrná velikost prodeje	54.7
Medián prodeje	14
Maximální prodej	39 097
Podíl nulových prodejů	8.1%

Z pohledu plánování jde o typický případ, který dobře ilustruje problémy, se kterými se modely v praxi setkávají.

Výběr testovacích scénářů

Délka dostupné historie je jedním z klíčových faktorů ovlivňujících kvalitu predikce. Proto všechny testy probíhaly na podmnožinách datasetu rozdělených podle délky historie jednotlivých produktů – od celého portfolia až po položky s velmi krátkou historií.

dlouhá historie (24+ měsíců)
střední historie (12–24 měsíců)
krátká historie (6–11 měsíců)
nové položky (1–5 měsíců)

Právě tato různorodost představuje hlavní problém – modely musí pracovat s produkty, které se chovají zcela odlišně, často s velmi omezeným množstvím dat.

Validace

Pro porovnání jednotlivých přístupů byla použita jednotná validační strategie, kdy byly modely trénovány na historických datech a testovány na následujícím období. Tento přístup odpovídá reálnému použití modelu, kdy predikujeme budoucnost na základě minulosti.

Výkon modelů byl hodnocen pomocí kombinované metriky vycházející z několika standardních ukazatelů přesnosti. Cílem nebylo optimalizovat jednu konkrétní hodnotu, ale získat robustní pohled na kvalitu predikce napříč různými typy produktů. Výsledná hodnota reprezentuje celkovou velikost chyby – čím nižší číslo, tím přesnější predikce. Důležité je ale vnímat ji v kontextu jednotlivých scénářů, protože rozdíly mezi modely se výrazně liší v závislosti na délce historie a charakteru dat.

Pro lepší interpretaci výsledků jsou jednotlivé scénáře dále rozděleny podle délky historie produktů.

Kde modely fungují podobně

Rozdíly mezi přístupy jsou zde relativně malé, a proto složitější modely nepřinášejí výraznou přidanou hodnotu z pohledu nákladů.
Modely mají dostatek dat pro zachycení trendu i sezónnosti, a proto zde fungují dobře i jednodušší statistické metody. Machine learning i deep learning sice dosahují o něco lepších výsledků, rozdíly se však projevují především u sezónních a promo položek, kde je chování méně stabilní.

V tomto scénáři proto složitější modely (DL) nepřinášejí zásadní přidanou hodnotu vzhledem ke své náročnosti.

Kde se začínají rozcházet

Se zkracující se historií začínají být rozdíly mezi přístupy výraznější. Statistické metody postupně ztrácejí schopnost zachytit sezónnost, protože nemají dostatek dat. Machine learning si udržuje relativně stabilní výkon, zatímco deep learning začíná získávat výhodu díky schopnosti pracovat s komplexnějšími vztahy a kontextem.

Klíčovým důvodem těchto rozdílů je právě délka dostupné historie.

Kde modely selhávají

Nejnáročnější scénáře představují produkty s krátkou historií. V těchto případech mají všechny přístupy výrazně omezené množství informací, což vede k poklesu přesnosti napříč modely. Deep learning zde získává výhodu díky schopnosti hledat podobnosti mezi produkty na základě dalších charakteristik. I přesto však zůstává predikce velmi nejistá a její praktická využitelnost je omezená.

Hlavním problémem tak není pouze volba modelu, ale především nedostatek kvalitních dat.

Vizualizace

Předchozí výsledky ukazují rozdíly na úrovni celých skupin. Podívejme se nyní na konkrétní příklady, které lépe ilustrují chování jednotlivých přístupů v praxi. Černá křivka představuje reálné hodnoty, barevné křivky predikce jednotlivých přístupů.

Tyto příklady dobře ilustrují rozdílné chování jednotlivých přístupů. Statistické přístupy mají tendenci predikce vyhlazovat a vracet se k průměru, což vede k podhodnocení špiček a přecenění slabších období. Machine learning reaguje na změny lépe, ale často se zpožděním. Deep learning dokáže zachytit komplexnější vzorce a rychleji reagovat na změny, zároveň však může být v některých případech citlivější na šum.

Tyto rozdíly se navíc výrazně mění v závislosti na délce historie – čím méně dat je k dispozici, tím více se projeví limity jednodušších přístupů.

Další vlivy ovlivňující predikci

Vedle délky historie existují i další faktory, které mají zásadní vliv na kvalitu predikce a často představují hlavní důvod selhání modelů v praxi.

Sezónnost

Některé produkty vykazují výraznou sezónnost – typicky s opakujícími se špičkami během roku, například v období Vánoc. Predikce zde závisí na schopnosti modelu správně zachytit opakující se vzorce v čase. Při dostatečně dlouhé historii si s tímto problémem poradí i jednodušší přístupy. Jakmile je ale historie kratší nebo se sezónnost v čase mění, začínají tyto modely selhávat a rozdíly mezi přístupy se výrazně prohlubují.

Nepravidelné prodeje

U části sortimentu se prodeje objevují nepravidelně, bez jasného vzorce. Náhodné výkyvy zanášejí do dat šum a ztěžují modelům rozlišení mezi skutečným trendem a náhodným chováním.

Jednodušší přístupy mají tendenci taková data zjednodušovat a vracet se k průměru. Složitější modely mají díky většímu množství parametrů a informací větší šanci zachytit alespoň část skrytých vzorců, i když ani zde nelze očekávat stabilní výsledky.

Promo akce

Specifickým případem jsou promo akce, které způsobují krátkodobé, výrazné nárůsty prodejů. Pokud model nemá informaci o tom, že se jedná o promo, vnímá tyto výkyvy jako šum.
Jednodušší přístupy pak tyto změny nedokážou správně interpretovat a často je buď ignorují, nebo na ně reagují se zpožděním. I pokročilejší modely zde naráží na limity, pokud nemají k dispozici relevantní vstupní informace.

Pokud jsou však tyto informace dostupné, mohou je složitější modely efektivněji využít díky schopnosti pracovat s větším množstvím vstupních proměnných a jejich vzájemnými vztahy.

Tyto faktory se v praxi často kombinují, což výrazně zvyšuje komplexitu celého problému. Právě jejich souběh je důvodem, proč jednoduché modely v reálných scénářích často selhávají a proč rozdíly mezi přístupy narůstají.

Shrnutí

Tento projekt ukazuje, že kvalita predikce není dána pouze volbou modelu, ale především charakterem dat.

Délka historie zásadně ovlivňuje, jak dobře model dokáže zachytit trend a sezónnost. U produktů s dostatečně dlouhou historií jsou rozdíly mezi přístupy relativně malé a jednodušší metody často postačují. S klesající délkou historie se však modely začínají výrazně rozcházet – statistické přístupy ztrácejí schopnost zachytit sezónnost, zatímco deep learning dokáže částečně kompenzovat nedostatek dat.

Zásadní roli přitom hrají i další faktory, jako je sezónnost a promo akce. Ty zvyšují komplexitu dat a bez odpovídajících vstupních informací představují pro modely významný problém bez ohledu na jejich typ.

Největší rozdíl mezi přístupy se tak neprojevuje v ideálních podmínkách, ale právě v situacích, které jsou v praxi nejčastější – tedy u produktů s omezenou historií a zároveň vysokou variabilitou způsobenou sezónností nebo promo akcemi.

V dalším článku se podíváme na dataset, kde většinu dat tvoří nulové prodeje – a kde se rozdíly mezi přístupy projeví ještě výrazněji.