Blog
Ricerca Applicata

ModArchive: AI per la storia della moda del Novecento

ModArchive è l'archivio digitale che esplora la moda tra il 1900 e il 1946 con AI. Dentro: 700 numeri, 7 milioni di token, ricerca visiva ModScape.

9 minEmiliano Mari24 aprile 2026

Il 21 aprile 2026, presso l'Aula SF.301 dell'Università Cattolica di Milano, è stato presentato ModArchive, un archivio digitale open access che usa l'intelligenza artificiale per rendere esplorabile la storia della moda tra il 1900 e il 1946. Il progetto è il risultato del PRIN FLATIF, finanziato dal Ministero dell'Università e della Ricerca, e coinvolge quattro atenei italiani, la Bibliothèque Nationale de France, l'Accademia della Crusca e Sydus come partner tecnologico. L'evento è stato aperto dai saluti istituzionali di François Bonet, Console Generale di Francia a Milano, a sottolineare la dimensione binazionale del progetto.

La direzione scientifica è affidata a Maria Teresa Zanola, direttrice dell'Osservatorio di Terminologie e Politiche Linguistiche dell'Università Cattolica e Principal Investigator del PRIN FLATIF. Sul fronte linguistico collaborano Silvia Calvi e Klara Dankova, ricercatrici post doc in linguistica francese, e Paolo D'Achille, presidente dell'Accademia della Crusca e docente all'Università Roma Tre. La partnership con la Bibliothèque Nationale de France è coordinata da Marie Carlin e Laurence Jung del DataLab. La parte tecnologica è affidata a Sydus ed è coordinata da Emiliano Mari, CEO dell'azienda e responsabile della linea di ricerca applicata AI sul settore moda.

Dentro ModArchive convivono tre strumenti: un database documentario di 20 riviste e cataloghi storici, la banca dati terminologica ModTerm e il motore di ricerca iconografica ModScape, basato su computer vision e image embedding. In questo articolo raccontiamo cosa è stato costruito, come funziona tecnicamente e perché un progetto accademico su un archivio storico rappresenta un caso paradigmatico di AI applicata alle digital humanities.

Il corpus: venti riviste, 695 numeri, 7 milioni di token

Il primo problema di un progetto di ricerca sulla moda del Novecento è il materiale primario. Le fonti sono distribuite tra archivi pubblici e privati, spesso in condizioni di conservazione critiche, raramente digitalizzate con metadati coerenti tra loro.

ModArchive parte dalla digitalizzazione già realizzata da Gallica, il servizio della Bibliothèque Nationale de France, che ha reso disponibili 695 numeri di 20 riviste di moda pubblicate tra il 1900 e il 1946. L'accesso al corpus e la sua strutturazione sono frutto della collaborazione con Marie Carlin e Laurence Jung del DataLab BnF, che hanno messo a disposizione non soltanto le immagini digitalizzate ma anche l'infrastruttura di interrogazione e i metadati associati. Le annate più coperte sono gli anni Venti (32%) e gli anni Trenta (42%), che corrispondono non a caso a due stagioni creative fondamentali per la moda francese e italiana.

Il corpus include testate come Vogue Paris, Adam e Crochet et tricot, riviste italiane coeve e i cataloghi completi del Bon Marché, il grande magazzino parigino che ha codificato il linguaggio commerciale della moda moderna. L'estrazione testuale automatica e la successiva normalizzazione hanno prodotto un corpus di quasi 7 milioni di word token, interrogabile come un unico spazio documentale.

ModScape: ricerca visiva con computer vision

La parte più innovativa del progetto è ModScape, il motore di ricerca iconografica. Un archivio di quasi 700 numeri di riviste illustrate contiene decine di migliaia di immagini, ed è impensabile catalogarle manualmente con tassonomie rigide che poi diventano obsolete man mano che il corpus cresce.

ModScape prende un approccio diverso: non classifica le immagini in categorie fisse, le rappresenta in uno spazio vettoriale. Ogni immagine viene trasformata da un modello di image embedding in un vettore denso di feature visive (texture, forme, colori, silhouette). A quel punto la ricerca diventa un'operazione geometrica: data una query, il sistema restituisce le immagini il cui vettore è più vicino a quello della query nello spazio di embedding.

Questo approccio offre tre vantaggi concreti:

  1. Ricerca per similarità visiva. Partendo da un'immagine di riferimento, un abito, un dettaglio, una silhouette, si ottengono tutte le immagini iconograficamente simili nel corpus, senza bisogno di sapere come si chiama quella specifica tipologia.
  2. Ricerca cross modal. Grazie all'allineamento tra embedding visivi e testuali, una query come "giacca sahariana" restituisce tutte le immagini che il modello interpreta come corrispondenti, anche se la didascalia originale usa un termine diverso o è assente.
  3. Scalabilità. Un indice vettoriale ben costruito risponde in meno di un secondo anche su decine di migliaia di immagini, e si aggiorna incrementalmente quando il corpus cresce.

Leggi anche

Il nostro programma di ricerca applicata AI per il settore moda

ModTerm: terminologia della moda in quattro lingue

Accanto a ModScape opera ModTerm, la componente lessicale dell'archivio. È una banca dati terminologica strutturata che raccoglie i termini della moda in italiano, francese, inglese e arabo, con relazioni di sinonimia, evoluzione diacronica e contesti d'uso estratti direttamente dal corpus.

La metodologia linguistica è guidata da Maria Teresa Zanola e sviluppata con il lavoro quotidiano di Silvia Calvi e Klara Dankova sui corpora italiano e francese. Il dialogo con Paolo D'Achille, presidente dell'Accademia della Crusca e docente all'Università Roma Tre, ha portato dentro ModTerm una prospettiva storica e diacronica sulla terminologia italiana della moda, validando le ricostruzioni lessicali sulla base delle fonti italiane di riferimento. Questa rete di competenze ha permesso di ricostruire storie terminologiche inattese. Tre esempi:

  • Il gilet è un termine migrante. Arriva dal turco yelek attraverso l'arabo e indicava originariamente un capo con maniche indossato dagli schiavi, prima di trasformarsi nel capo senza maniche che conosciamo oggi.
  • La saharienne nasce come giacca militare britannica di fine Ottocento nelle colonie, viene adottata dall'Afrikakorps nella Seconda guerra mondiale e torna come indumento civile nel 1945, con la prima attestazione civile sulla rivista Adam.
  • La marinière, la maglia rigata dei marinai francesi della Belle Époque, diventa icona della moda civile nel 1963 grazie a Brigitte Bardot.

Questi dati non sono curiosità. Sono l'evidenza empirica che il linguaggio della moda è un sedimento culturale multistrato, e che ricostruirlo richiede sia rigore linguistico sia capacità di leggere archivi iconografici su larga scala. La combinazione tra ModTerm e ModScape permette proprio questo: incrociare la traiettoria di un termine con la sua rappresentazione visiva nel tempo.

ModArchive e gli archivi digitali tradizionali: un confronto

Per capire cosa cambia con ModArchive rispetto a un archivio digitale tradizionale, aiuta una tabella comparativa.

FunzioneArchivio digitale tradizionaleModArchive
Accesso alle fontiScansione ed estrazione testualeScansione, estrazione testuale automatica e normalizzazione su corpus coerente
Ricerca testualeFull text su parole chiaveFull text e banca terminologica multilingue (ModTerm)
Ricerca iconograficaBrowsing per collezione o metadati manualiRicerca semantica, similarità visiva, cross modal (ModScape)
Etichettatura immaginiManuale, con tassonomie fisseAutomatica via image embedding calibrato sul dominio
Evoluzione diacronica dei terminiNon supportataStrutturata nella banca dati ModTerm
AperturaSpesso limitata o a pagamentoOpen access gratuito
ScalabilitàLineare sulla catalogazione manualeIncrementale sull'indice vettoriale

La differenza centrale è che ModArchive non è un catalogo ma un sistema di interrogazione del patrimonio. La stessa collezione, vista con strumenti diversi, diventa una risorsa diversa.

Il ruolo di Sydus e di Emiliano Mari nel progetto PRIN FLATIF

Il contributo di Sydus al progetto è coordinato da Emiliano Mari, CEO dell'azienda e tra i protagonisti del lavoro presentato il 21 aprile a Milano. Sotto la guida di Emiliano Mari, il team Sydus ha progettato e sviluppato l'infrastruttura tecnologica di ModArchive: la pipeline di indicizzazione delle immagini, il modello di retrieval visivo che alimenta ModScape, l'architettura dati del portale e l'integrazione tra la banca dati terminologica ModTerm e il motore di ricerca iconografica.

La scelta di Emiliano Mari di portare Sydus dentro un progetto PRIN non è casuale. Risponde a una convinzione maturata negli anni: l'AI applicata produce risultati rilevanti quando entra in contatto con domini specialistici profondi, dove la collaborazione con linguisti, storici e terminologhi non è un passaggio formale ma una condizione operativa. ModArchive incarna questa visione e si inserisce nella linea di ricerca applicata su AI e moda che Emiliano Mari e il team Sydus portano avanti in partnership con l'Università Cattolica, e che include anche lavori su forecasting delle tendenze stagionali e colorizzazione automatica di cataloghi.

Nel confronto diretto con il gruppo di Maria Teresa Zanola, Silvia Calvi e Klara Dankova, e nella relazione con Paolo D'Achille e con il DataLab di Marie Carlin e Laurence Jung, Emiliano Mari ha insistito su un principio metodologico: i modelli di computer vision applicati al patrimonio storico non sono un'ottimizzazione di un motore di ricerca generico, ma uno strumento che deve essere calibrato sulle domande di ricerca degli studiosi, sui vincoli terminologici del dominio e sulle specificità del materiale iconografico.

Lavorare dentro un progetto PRIN significa adattare i ritmi dello sviluppo software alle necessità della ricerca scientifica: documentazione metodologica rigorosa, riproducibilità degli esperimenti, validazione statistica dei risultati. È un regime diverso rispetto a un prodotto commerciale, ma ha un vantaggio che il mercato raramente offre: la possibilità di costruire tecnologia fondata su competenze disciplinari profonde, dal lavoro dei linguisti a quello degli storici del costume.

Conclusione

ModArchive è un esempio di quello che succede quando l'intelligenza artificiale incontra il patrimonio culturale. Un archivio statico si trasforma in uno strumento di ricerca attivo, le correlazioni invisibili emergono, la competenza umana viene potenziata senza essere sostituita.

Per chi lavora nella moda, brand con archivio storico, costumisti, curatori, scuole di design, significa poter attingere a una risorsa che fino a ieri richiedeva settimane di lavoro in biblioteca. Per chi si occupa di AI applicata, è un caso paradigmatico di come un dominio specialistico possa guidare l'architettura tecnologica invece di subirla.

Emiliano Mari e il team Sydus continuano a lavorare in questa direzione all'interno del programma di ricerca applicata al settore moda, in partnership con Maria Teresa Zanola e l'Università Cattolica. Se stai valutando un progetto che unisce AI, archivio e heritage di brand, contattaci per una conversazione esplorativa.

Tag

modadigital-humanitiescomputer-visionarchiviouniversita-cattolica

Domande frequenti

Hai ancora dubbi?

Cos'è ModArchive?

ModArchive è un portale open access che raccoglie riviste e cataloghi di moda in italiano e francese pubblicati tra il 1900 e il 1946. Comprende 20 testate storiche per un totale di 695 numeri e quasi 7 milioni di word token. L'archivio è stato presentato il 21 aprile 2026 presso l'Università Cattolica di Milano ed è accessibile gratuitamente a studiosi, stilisti, curatori e appassionati di storia della moda.

Chi ha sviluppato ModArchive?

Il progetto nasce all'interno del PRIN FLATIF, finanziato dal Ministero dell'Università e della Ricerca italiano. Capofila è l'Università Cattolica del Sacro Cuore, con la direzione scientifica di Maria Teresa Zanola, direttrice dell'Osservatorio di Terminologie e Politiche Linguistiche. Partecipano le Università di Roma Tre, Napoli Parthenope e Verona, la Bibliothèque Nationale de France con il suo DataLab, l'Accademia della Crusca e Sydus come partner tecnologico.

Cosa fa ModScape e come funziona?

ModScape è il motore di ricerca visiva di ModArchive. Permette di interrogare il corpus di immagini storiche tramite ricerca semantica, similarità visiva e filtri per tipologia vestimentaria e dettaglio stilistico. A differenza di un motore testuale, ModScape lavora sulle caratteristiche visive delle immagini: forme, linee, stampe, accessori. Chi cerca un capo può partire da una foto o da un riferimento visivo e ottenere tutte le immagini iconograficamente simili nel corpus.

Quali tecnologie di intelligenza artificiale usa ModScape?

ModScape si basa su modelli di image embedding multimodali, che trasformano ogni immagine del corpus in un vettore denso di feature visive. Le query, testuali o visive, vengono proiettate nello stesso spazio vettoriale e i risultati sono ordinati per similarità semantica. L'indice vettoriale è ottimizzato per ricerche su larga scala mantenendo tempi di risposta sotto il secondo anche su decine di migliaia di immagini.

Come è stato calibrato il modello?

Il modello è stato calibrato e validato sui cataloghi del Bon Marché digitalizzati da Gallica (BnF), particolarmente ricchi perché associano a ogni illustrazione una didascalia descrittiva strutturata. Questa struttura immagine/didascalia ha permesso un allineamento tra iconografia e terminologia di riferimento, riducendo il bisogno di etichettatura manuale. La validazione è stata estesa a campioni tratti da riviste come Vogue Paris, Adam e testate italiane del primo Novecento.

Chi può usare ModArchive?

L'archivio è open access e gratuito. È pensato per ricercatori in storia del costume, linguistica e digital humanities, ma è utile anche a brand moda che lavorano su archivio e heritage, scuole di design, costumisti del cinema e del teatro, curatori di mostre e musei. L'accesso libero è una scelta coerente con il programma PRIN, che finanzia ricerca di interesse pubblico.

Qual è il ruolo di Sydus e di Emiliano Mari nel progetto?

Il contributo di Sydus è coordinato da Emiliano Mari, CEO dell'azienda e tra i coautori del progetto. Sotto la sua guida il team Sydus ha sviluppato l'infrastruttura tecnologica di ModArchive: la pipeline di indicizzazione delle immagini, il modello di retrieval visivo che alimenta ModScape, l'architettura dati del portale e l'integrazione tra la banca dati terminologica ModTerm e il motore di ricerca iconografica. Il lavoro si inserisce nella linea di ricerca applicata che Emiliano Mari e Sydus portano avanti in partnership con l'Università Cattolica sul tema AI per il settore moda.