Il lavoro focalizza l’attenzione sull’analisi esplorativa dei dati attraverso l’impiego di strutture ad albero a due stadi. Gli argomenti trattati nei 4 capitoli ed appendice in cui si articola la tesi ed i contributi proposti, costituiscono una presentazione unitaria e rielaborata di risultati già discussi o pubblicati dal candidato nonché di proposte inedite, oggetto di lavori in corso di pubblicazione. Essi rappresentano il frutto di ricerche condotte sugli aspetti metodologici ed applicativi delle metodologie ad albero a due stadi, con riferimento a problematiche applicative che il candidato ha incontrato nello studio di fenomeni reali; in particolare, nel proprio percorso di ricerca, il candidato ha perseguito un triplice obiettivo, metodologico, computazionale ed applicativo. In un contesto metodologico, il candidato si è interessato ad un percorso di analisi volto alla esplorazione di grandi dataset attraverso l’impiego di strutture ad albero a due stadi che fanno uso di misure alternative di impurità (Two-Stage e FAST) e di modelli parametrici (funzioni discriminati e modelli a bilanci latenti) per la definizione del criterio di partizione e per l’introduzione di strategie di data mining. In un’ottica computazionale, il candidato si è impegnato nello sviluppo di un prototipo software, Exploratory Trees, scritto interamente in ambiente MatLab e nel quale sono implementate, secondo un approccio interattivo e visuale, le diverse metodologie trattate. Infine, il contesto applicativo ha riguardato il disegno di dati simulati per alcune delle elaborazioni proposte per la validazione ed il confronto delle diverse procedure, così come l’utilizzo sia di dati reali ben noti in letteratura sia di una base dati collezionata ad hoc in occasione della verifica empirica di una strategia integrata proposta per la Market Basket Analysis.
Un software fruibile ed interattivo per l’apprendimento statistico dai dati attraverso alberi esplorativi: Contributi metodologici ed applicativi / Siciliano, Roberta. - (2004).
Un software fruibile ed interattivo per l’apprendimento statistico dai dati attraverso alberi esplorativi: Contributi metodologici ed applicativi
SICILIANO, ROBERTA
2004
Abstract
Il lavoro focalizza l’attenzione sull’analisi esplorativa dei dati attraverso l’impiego di strutture ad albero a due stadi. Gli argomenti trattati nei 4 capitoli ed appendice in cui si articola la tesi ed i contributi proposti, costituiscono una presentazione unitaria e rielaborata di risultati già discussi o pubblicati dal candidato nonché di proposte inedite, oggetto di lavori in corso di pubblicazione. Essi rappresentano il frutto di ricerche condotte sugli aspetti metodologici ed applicativi delle metodologie ad albero a due stadi, con riferimento a problematiche applicative che il candidato ha incontrato nello studio di fenomeni reali; in particolare, nel proprio percorso di ricerca, il candidato ha perseguito un triplice obiettivo, metodologico, computazionale ed applicativo. In un contesto metodologico, il candidato si è interessato ad un percorso di analisi volto alla esplorazione di grandi dataset attraverso l’impiego di strutture ad albero a due stadi che fanno uso di misure alternative di impurità (Two-Stage e FAST) e di modelli parametrici (funzioni discriminati e modelli a bilanci latenti) per la definizione del criterio di partizione e per l’introduzione di strategie di data mining. In un’ottica computazionale, il candidato si è impegnato nello sviluppo di un prototipo software, Exploratory Trees, scritto interamente in ambiente MatLab e nel quale sono implementate, secondo un approccio interattivo e visuale, le diverse metodologie trattate. Infine, il contesto applicativo ha riguardato il disegno di dati simulati per alcune delle elaborazioni proposte per la validazione ed il confronto delle diverse procedure, così come l’utilizzo sia di dati reali ben noti in letteratura sia di una base dati collezionata ad hoc in occasione della verifica empirica di una strategia integrata proposta per la Market Basket Analysis.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.