ModArchive: AI per la storia della moda del Novecento
Venti riviste, 695 numeri, quasi 7 milioni di token e un motore di ricerca visiva calibrato sui cataloghi del Bon Marché. Così ModArchive usa l'AI per raccontare la moda del Novecento.
La computer vision analizza immagini di sfilate e social per anticipare i trend stagionali con mesi di anticipo. Ecco come funziona la pipeline e i risultati ottenibili.
Nel settore moda, il lead time tra la decisione di produzione e l'arrivo del prodotto in negozio è tipicamente di 6-18 mesi. Questo significa che chi decide oggi cosa produrre lo fa senza sapere con certezza cosa il mercato vorrà tra un anno. Il costo di sbagliarsi è concreto: invenduto che occupa magazzino, svalutazioni di fine stagione, perdita di margine.
La computer vision applicata all'analisi dei trend stagionali è uno degli strumenti che stiamo sviluppando all'interno del progetto di ricerca condotto da Sydus in partnership con l'Università Cattolica. L'obiettivo è ridurre l'incertezza decisionale attraverso l'analisi automatica di grandi volumi di immagini.
I brand fast fashion lavorano su cicli di 2-4 settimane. I brand premium e luxury lavorano su stagioni da 6-12 mesi. In entrambi i casi, l'errore di previsione si misura in percentuale di sell-through: quanta parte della collezione viene venduta a prezzo pieno.
Un sell-through sotto il 70% è generalmente considerato critico. Significa che oltre il 30% del prodotto finirà in saldi, outlet o distruzione. In termini economici, l'eccesso di magazzino nel retail fashion europeo vale miliardi ogni anno.
Il paradosso è che i segnali dei trend futuri esistono già nei dati disponibili, nelle immagini delle sfilate, nei post degli influencer, nei pin di Pinterest, ma sono troppo numerosi e disorganizzati per essere analizzati manualmente.
La pipeline si articola in fasi distinte.
1. Raccolta dati (scraping e API)
Le fonti principali sono:
2. Preprocessing
Le immagini vengono normalizzate (ridimensionamento, normalizzazione dei canali RGB), il soggetto viene isolato dallo sfondo tramite segmentazione semantica, e i metadati (data, fonte, brand, stagione) vengono associati a ciascuna immagine.
3. Feature extraction con CNN
Una rete neurale convoluzionale pre-addestrata (tipicamente ResNet-50 o EfficientNet-B4) estrae un vettore di feature ad alta dimensione da ciascuna immagine. Queste feature rappresentano pattern visivi, bordi, texture, colori, forme, a vari livelli di astrazione.
Su questo layer vengono addestrati classificatori specifici:
4. Clustering e trend scoring
Le feature estratte vengono raggruppate tramite clustering (K-Means o DBSCAN) per identificare macro-trend visivi. A ciascun cluster viene assegnato uno score di trend che combina:
Nell'ambito del progetto di ricerca applicata condotto in collaborazione con l'Università Cattolica, abbiamo applicato questa pipeline su dati delle ultime quattro stagioni per un segmento specifico del mercato italiano.
I risultati preliminari mostrano:
Questi numeri non sono universali: dipendono dalla qualità e completezza dei dati storici, dal segmento di mercato e dalla granularità delle previsioni richieste. Sono però indicativi di un ordine di grandezza realistico per chi opera su scale comparabili.
Dal punto di vista infrastrutturale, la pipeline richiede:
Il tempo medio per portare la pipeline a un livello operativo stabile è di 3-6 mesi, con un team di 2-3 persone tra ML engineer e domain expert del settore moda.
La computer vision per il trend forecasting nella moda è una disciplina giovane. Le aree di ricerca più attive includono il cross-market forecasting (prevedere come un trend nato in Asia si diffonderà in Europa), l'integrazione con dati di sell-through real-time per chiudere il ciclo di feedback, e la generazione di brief creativi automatici a partire dal trend scoring.
Il punto di arrivo non è sostituire il giudizio del designer, ma dargli dati strutturati su cui basare le decisioni, trasformando un processo oggi in gran parte intuitivo in uno più sistematico e misurabile.
Tag
Domande frequenti
La computer vision sui social rispetta il copyright?
Il tema è complesso e in rapida evoluzione normativa. L'uso di immagini pubbliche da social media a fini di ricerca o analisi aggregata è generalmente considerato legittimo in molte giurisdizioni, ma dipende dai termini di servizio della piattaforma e dalla destinazione d'uso dei dati. Le API ufficiali di piattaforme come Pinterest sono lo strumento preferito perché forniscono dati in modo strutturato e nel rispetto dei loro ToS. Per uso commerciale diretto delle immagini è necessaria una consulenza legale specifica.
Con quante immagini si allena il modello?
Dipende dalla granularità della classificazione. Per un classificatore di macro-categorie (vestiti, calzature, accessori) bastano poche migliaia di immagini etichettate per categoria con transfer learning da un modello pre-addestrato come ResNet o ViT. Per task più granulari, riconoscimento di pattern specifici come stampe geometriche vs. floreali, servono dai 1.000 ai 5.000 esempi per classe. La data augmentation (rotazioni, flip, variazioni di luminosità) permette di moltiplicare il dataset esistente.
Quanto tempo prima anticipa i trend?
Le sfilate delle fashion week anticipano le collezioni di 6-9 mesi rispetto all'arrivo in negozio. L'analisi dei social media può rilevare trend emergenti con 3-6 mesi di anticipo rispetto alla loro diffusione di massa. Combinando le due fonti, runway images + early adopter social signal, si ottiene una finestra operativa di 4-8 mesi, sufficiente per orientare le decisioni di produzione e acquisto.
Continua a leggere
Venti riviste, 695 numeri, quasi 7 milioni di token e un motore di ricerca visiva calibrato sui cataloghi del Bon Marché. Così ModArchive usa l'AI per raccontare la moda del Novecento.
Due approcci diversi per prevedere il futuro dai dati storici. Capire le differenze tra ARIMA e Prophet può fare la differenza tra una previsione accurata e un modello inutilizzabile.
ARIMA e i metodi classici assumono stazionarietà. I visibility graph lavorano dove questi falliscono: serie finanziarie, energetiche, climatiche con cambi di regime improvvisi.