Tematiche di ricerca
In
[Malchiodi
e
Pedrycz, 2013; Malchiodi, 2019a]
è stato proposto un algoritmo di apprendimento per insiemi fuzzy
a partire da dati etichettati con i rispettivi gradi di appartenenza.
Tale algoritmo è stato applicato al mining di assiomi nell'ambito
del Web semantico
[Malchiodi
e
Tettamanzi, 2018]
e alla
selezione di esempi negativi per problemi di bioinformatica
[Frasca
e
Malchiodi, 2017; Frasca
e
Malchiodi, 2016]
.
L'approccio proposto è stato esteso in
[Cermenati et al., 2020]
all'induzione simultanea di più
insiemi fuzzy e in
[Malchiodi
e
Zanaboni, 2019]
all'apprendimento di shadowed set.
in collaborazione con
Prof. Zanaboni (Università degli Studi di Milano),
Prof. Pedrycz (University of Alberta)
La conoscenza indotta tramite tecniche di machine learning
è spesso codificata e memorizzata in modo distribuito all'interno
dei modelli appresi a partire dai dati. Ciò può rendere difficile
l'interpretazione qualitativa dei risultati ottenuti, oltre a
costituire un potenziale problema in caso di risorse limitate in
termini di banda e capacità di memorizzazione. Una possibile
soluzione a questi problemi consiste nel ridurre lo spazio
necessario per memorizzare i suddetti modelli dopo la fase di
apprendimento. Nell'ambito del progetto PRIN Multicriteria
Data Structures and Algorithms: from compressed to learned indexes,
and beyond vengono studiate tecniche di compressione per reti
neurali apprese tramite algoritmi di deep learning
[Marinò et al., 2021]
. La loro implementazione è
descritta in
[Marinò et al., 2021]
.
in collaborazione con
Prof. Frasca (Università degli Studi di Milano)
La ricerca di potenziali assiomi all'interno di insiemi di formule
è un problema particolarmente oneroso dal punto di vista
computazionale. La soluzione di indurre tali assiomi sulla base
di formule etichettate con una misura di bontà precalcolata a
partire da una base di conoscenza nell'ambito del Web semantico
è stata affrontata utilizzando algoritmi di apprendimento per
insiemi fuzzy
[Malchiodi
e
Tettamanzi, 2018]
e tecniche di
regressione basate su metodi kernel
[Malchiodi et al., 2018]
. In
[Malchiodi et al., 2020]
viene analizzata la dipendenza
di questo problema rispetto agli algoritmi di apprendimento
utilizzati e alle tecniche di riduzione della dimensionalità
impiegate per codificare gli assiomi tramite vettori numerici.
in collaborazione con
Prof. Da Costa Pereira, Prof. Tettamanzi
(Université de la Côte d'Azur)
L'applicazione di metodi di appredimento supervisionato in
bioinformatica richiede di selezionare tra i dati non etichettati
positivamente quelli che rappresentano esempi negativi affidabili
e non semplicemente entità su cui non sono stati fatti esperimenti.
In
[Frasca
e
Malchiodi, 2017; Frasca
e
Malchiodi, 2016]
tale problema di selezione dei negativi è stato affrontato
utilizzando un ranking basato su funzioni di appartenenza a
insiemi fuzzy, mentre in
[Frasca et al., 2017; Boldi et al., 2018]
è stata proposta una codifica dei dati
a disposizione che faciliti il processo di selezione dei negativi
nel problema della predizione di funzionalità proteiche. Infine,
in
[Frasca et al., 2019]
una procedura simile
è stata applicata al problema della prioritizzazione dei geni.
in collaborazione con
Prof. Frasca (Università degli Studi di Milano)
[Casiraghi et al., 2020]
e
[Esposito et al., 2021]
descrivono l'applicazione
di tecniche di apprendimento automatico al problema della
previsione del grado di gravità del COVID-19 dei pazienti che si
presentano al pronto soccorso.
in collaborazione con
Prof. Valentini (Università degli Studi di Milano)
Prof. Casiraghi (Università degli Studi di Milano)
Prof. Frasca (Università degli Studi di Milano)
Sono state adattate tecniche di machine learning e di analisi
statistica dei dati a problemi in ambito veterinario e forense. In
particolare,
[Galizzi et al., 2021]
e
[Bagardi et al., 2021]
descrivono l'applicazione di
tecniche statistiche al fine di classificare l'incidenza di fattori
cardiovascolari nel decesso di cani sottoposti a specifica terapia,
mentre
[Casali et al., 2021]
discute uno studio
pilota sull'applicazione di algoritmi di classificazione per la
predire il tipo di veicolo coinvolto nell'investimento di un
pedone.
in collaborazione con
Prof. Zanaboni (Università degli Studi di Milano)
I modelli di apprendimento automatico hanno come punto di partenza
un campione etichettato i cui dati sono trattati in modo omogeneo
(cioè hanno la medesima importanza). In
[Malchiodi, 2008]
è stato introdotto il modello
più generale di apprendimento basato su rilevanza, in cui è possibile
associare a ognuno dei dati disponibili una quantificazione numerica
della sua importanza relativa rispetto ai dati rimanenti. Tale
modello è stato applicato al problema della classificazione tramite
Support Vector Machine, derivando gli algoritmi di classificazione
sia nella versione lineare
[Apolloni
e
Malchiodi, 2006]
che in quella basata su kernel
[Apolloni et al., 2007]
. Una prima analisi teorica
di queste applicazioni è stata proposta in
[Apolloni et al., 2007]
, affiancata da un'analisi
sperimentale in
[Malchiodi, 2009]
, mentre la sua
applicazione a problemi di natura bioinformatica è descritta in
[Malchiodi et al., 2010]
. Un approccio simile è stato
inoltre applicato al problema della regressione in
[Apolloni et al., 2010; Malchiodi et al., 2009; Apolloni et al., 2005]
e all'apprendimento da esempi
sbilanciati in
[Malchiodi, 2013b]
.
Sono stati progettati, implementati e analizzati differenti tipi di
algoritmi di apprendimento. In particolare,
[Malchiodi
e
Legnani, 2014]
propone un'estensione di
algoritmi di classificazione basati su vettori di supporto che
permette di lavorare sia con dati parzialmente etichettati, sia con
etichette incerte, mentre
[Malchiodi
e
Pedrycz, 2013]
introduce un algoritmo di apprendimento per le funzioni di
appartenenza di insiemi fuzzy, specializzato in
[Malchiodi
e
Zanaboni, 2019]
all'induzione di shadowed set.
Relativamente alla didattica a livello universitario sono stati
pubblicati un manuale per l'utilizzo di software di calcolo
automatico e un eserciziario di Sistemi operativi
[Malchiodi, 2007; Malchiodi, 2015]
. A un
livello più divulgativo,
[Monga et al., 2017]
è un volume incentrato sulla figura di Alan Turing e
[Malchiodi, 2019a]
descrive potenziali
sviluppi futuri delle metodologie basate su insiemy fuzzy.
in collaborazione con
laboratorio ALaDDIn (Università degli Studi di Milano)
In
[Bellettini et al., 2014]
viene introdotto l'approccio algomotorio per un insegnamento
dell'informatica incentrato sulla tematica di base dell'elaborazione
automatica dell'informazione, al fine di contrastare un insegnamento
legato quasi esclusivamente alla conoscenza del funzionamento di
specifici strumenti tecnologici
[Lonati et al., 2015; Bellettini et al., 2014; Bellettini et al., 2020]
.
L'approccio proposto è stato valutato nell'ambito dell'abilitazione
all'insegnamento
[Bellettini et al., 2015]
, con
particolare attenzione a un'ottica costruttivista
[Bellettini et al., 2018; Bellettini et al., 2018]
.
È inoltre stato studiato il rapporto tra insegnamento e gare non
competitive
[Lonati et al., 2017]
, valutando
l'impatto che la presentazione dei quesiti ha sulla loro efficacia
[Lonati et al., 2017]
.
in collaborazione con
laboratorio ALaDDIn (Università degli Studi di Milano)
A partire da un'analisi delle modalità di insegnamento
dell'informatica nelle scuole italiane
[Bellettini et al., 2014]
e da una critica alle
posizioni che tendono a identificare la programmazione con
l'uso di un linguaggio per codificare un algoritmo
[Lonati et al., 2015]
, il tema della didattica
della programmazione è stato studiato in ottica della sua
introduzione tramite progetti e strumenti specifici
[Bulgheroni
e
Malchiodi, 2009; Paterson et al., 2015]
,
in termini interdisciplinari con le discipline musicali
[Ludovico et al., 2017; Baraté et al., 2017; Baratè et al., 2017]
e arrivando a considerare
l'introduzione di aspetti avanzati della disciplina
[Lonati et al., 2016; Lonati et al., 2017]
.
Un approccio costruzionista all'insegnamento della programmazione
è infine stato analizzato in
[Monga et al., 2018; Lodi et al., 2019]
, mentre
[Condorelli
e
Malchiodi, 2022]
descrive la progettazione di
un insegnamento di architetture per big data, svolta congiuntamente
a un partner industriale.
in collaborazione con
laboratorio ALaDDIn (Università degli Studi di Milano)
Unitamente all'organizzazione di gare non competitive sul
territorio nazionale
[Lissoni et al., 2012; Lissoni et al., 2013; Lissoni et al., 2014; Lissoni et al., 2015]
e all'analisi critica
dei loro esiti
[Bellettini et al., 2015; Lonati et al., 2017]
, è stato analizzato come questo
strumento possa essere utilizzato come risorsa
per l'apprendimento
[Lonati et al., 2017; Calcagni et al., 2017; Morpurgo et al., 2018]
nelle scuole primarie e secondarie.
in collaborazione con
laboratorio ALaDDIn (Università degli Studi di Milano)
L'approccio algomotorio introdotto in
[Bellettini et al., 2014; Bellettini et al., 2014]
è stato applicato alla presentazione di concetti cardine
dell'informatica, quali la rappresentazione dell'informazione
[Bellettini et al., 2012; Bellettini et al., 2013; Baraté et al., 2017]
, i rudimenti della programmazione
[Baratè et al., 2017]
e le strategie ricorsive
e greedy
[Lonati et al., 2016; Lonati et al., 2017; Lonati et al., 2017]
.
in collaborazione con
laboratorio ALaDDIn (Università degli Studi di Milano)
Il modello di granular computing, che caratterizza l'informazione in
senso granulare permettendo la sua analisi e la sua elaborazione a
differenti livelli di astrazione, è descritto in
[Apolloni et al., 2008]
analizzandone i legami con il
modello di apprendimento automatico. Sono stati analizzati alcuni
possibili impatti della fusione di questi due modelli sul campo della
regressione, proponendo algoritmi basati su Support Vector Machine
[Apolloni et al., 2008; Apolloni et al., 2006]
e su
tecniche di ricerca locale
[Apolloni et al., 2005]
.
Le tecniche bootstrap applicano modelli di ricampionamento dei dati
al fine di derivare la distribuzione di una popolazione. Una variante
di queste tecniche, proposta inizialmente in
[Apolloni et al., 2006]
e successivamente approfondita
in
[Apolloni et al., 2009; Apolloni et al., 2007]
,
permette di ricavare regioni di confidenza per curve di regressione
abbandonando le usuali assunzioni sulla distribuzione degli errori
di misurazione. L'applicazione di tale tecnica a problemi di
regressione lineare e non lineare è descritta in
[Apolloni et al., 2008]
, mentre in
[Apolloni et al., 2007]
sono contenute applicazioni a
problemi medici.
In
[Apolloni et al., 2006; Apolloni et al., 2005; Apolloni et al., 2002; Apolloni et al., 2002; Apolloni
e
Malchiodi, 2001; Malchiodi, 2000]
si è affrontato il problema di unificare sotto uno stesso modello
teorico detto di Inferenza Algoritmica istanze inferenziali tipiche
sia dell'ambito statistico (stima puntuale e per intervalli di
parametri di distribuzioni) che di quello informatico (stima
dell'errore di approssimazione in problemi di apprendimento
computazionale), sviluppando dei precedenti risultati teorici
riguardanti la complessità campionaria per problemi di apprendimento
[Apolloni
e
Malchiodi, 2001]
. Tale modello è stato
utilizzato per stimare il rischio per problemi di classificazione
risolti utilizzando delle Support Vector Machine
[Apolloni et al., 2007; Apolloni et al., 2005; Apolloni
e
Malchiodi, 2002; Apolloni
e
Malchiodi, 2001]
,
all'apprendimento di regioni di confidenza per rette di regressione
in assenza delle usuali ipotesi di distribuzione Gaussiana
dell'errore
[Apolloni et al., 2005; Apolloni et al., 2002]
, e per apprendere regioni di
confidenza per la funzione di rischio delle distribuzioni per il
tempo di ri-occorrenza in particolari patologie tumorali
[Apolloni et al., 2007; Apolloni et al., 2005; Apolloni et al., 2002]
.
I sistemi per il calcolo automatico permettono di effettuare
simulazioni e di analizzare problemi matematici in modalità
interattiva e incrementale, e in tal senso offrono interessanti
spunti per la progettazione di attività didattiche
[Bulgheroni
e
Malchiodi, 2009; Malchiodi, 2008a]
.
Una versione commerciale di questi sistemi è stata ampiamente
descritta in
[Malchiodi, 2007]
, e ampliata al fine
di risolvere problemi di matrice prettamente informatica relativi
alla codifica dell'informazione
[Malchiodi, 2006c]
,
all'invocazione remota di procedure
[Malchiodi, 2006b; Malchiodi, 2006]
, alla produzione di documentazione
scientifica
[Malchiodi, 2011]
, alla risoluzione
di problemi di ottimizzazione
[Malchiodi, 2006a]
e di apprendimento basato su vettori di supporto
[Malchiodi et al., 2009; Malchiodi et al., 2009]
, nonché di effettuare
validazione di software
[Malchiodi, 2013a]
.
Tale codice è alla base delle simulazioni descritte in
[Apolloni et al., 2007; Apolloni
e
Malchiodi, 2006]
.
Infine, in
[Malchiodi, 2010a]
viene descritta una
libreria per la gestione di problemi di machine learning basata su
un sistema open source di calcolo automatico.
I sistemi ibridi di apprendimento sono tipicamente realizzati
accoppiando moduli subsimbolici (basati tipicamente su paradigmi
derivati da quello delle reti neurali) con moduli simbolici
(realizzati in termini di costrutti logici). In
[Apolloni et al., 2005; Apolloni et al., 2004]
viene descritto un siffatto sistema che, avendo in ingresso una
serie di feature che descrivono i dati disponibili, estrae da esse
un insieme di componenti Booleane indipendenti (bICA). Su tali
componenti, interpretate come valori di verità, vengono costruite
delle formule logiche che descrivono simbolicamente relazioni
intercorrenti tra i dati forniti in input
[Apolloni et al., 2006; Apolloni et al., 2003; Apolloni et al., 2002; Apolloni et al., 2000]
. In
[Apolloni et al., 2004]
viene descritta
l'applicazione di un siffatto sistema al problema del
riconoscimento delle emozioni di un insieme di persone sulla
base del segnale vocale, mentre in
[Apolloni et al., 2004; Apolloni et al., 2004; Apolloni et al., 2003; Apolloni et al., 2003; Apolloni et al., 2003]
viene affrontata l'applicazione di questo tipo di sistemi al
controllo dello stato di attenzione durante l'utilizzo di
un'autovettura in funzione di biosegnali, nell'ambito del programma
di ricerca IST-2000-26091 ORESTEIA (mOdular hybRid artEfactS wiTh
adaptivE functIonAlity, finanziato dalla UE nel quinto programma
quadro all'interno delle tematiche IST-FET tra il 2001 e il 2003).
Infine, in
[Apolloni
e
Malchiodi, 2006; Apolloni et al., 2005]
vengono descritti due
sistemi ibridi ottenuti integrando un sistema fuzzy per la
misurazione della rilevanza dei punti in un campione rispettivamente
con un classificatore lineare basato su Support Vector Machine e
con un modello di regressione lineare.
Nell'ambito della teoria dell'apprendimento computazionale, il
principio di minimizzazione del rischio strutturale studia il
problema di bilanciare la semplicità di un modello con la sua
accuratezza nel predire i dati sperimentali. Questa parte
dell'attività di ricerca è incentrata sull'applicazione del
suddetto principio a classificatori basati sull'utilizzo di
espressioni logiche costruite in termini di forme normali
disgiuntive e congiuntive. In
[Apolloni et al., 2006; Apolloni et al., 2005; Apolloni et al., 2003; Apolloni et al., 2002; Apolloni et al., 2002]
si è sviluppato un algoritmo di semplificazione per tali forme,
incentrandosi sull'ottimizzazione stocastica di parametri relativi
a insiemi fuzzy che descrivono le suddette forme.
Relativamente a questa questa tematica, l'attività di ricerca è
focalizzata sul problema di modellare matematicamente delle
situazioni di conflitto utilizzando un approccio alternativo a
quello della teoria dei giochi classica. In particolare, in
[Apolloni et al., 2006; Apolloni et al., 2003; Apolloni et al., 2002; Apolloni et al., 2002]
tali
conflitti sono stati modellati in termini dell'approssimazione
della soluzione di un problema NP-hard, applicando il modello di
Inferenza Algoritmica per determinare come assegnare delle risorse
computazionali limitate ai giocatori, prevedendo giochi tra due
contendenti, mentre in
[Apolloni et al., 2006]
il
modello è stato esteso ai giochi di squadra. In
[Apolloni et al., 2007; Apolloni et al., 2005]
questo modello trova applicazione in un campo biologico, mentre in
[Apolloni et al., 2010]
viene descritto il suo utilizzo
al fine di dimensionare il tempo di esecuzione degli algoritmi di
apprendimento basati sulla minimizzazione locale dell'errore.
Il progetto di ricerca ORESTEIA (mOdular hybRid artEfactS wiTh
adaptivE functIonAlity, finanziato dalla UE nel quinto programma
quadro all'interno delle tematiche IST-FET tra il 2001 e il 2003)
è stato incentrato sulla progettazione, realizzazione e analisi di
sistemi intelligenti nell'ambito del pervasive e dell'ubiquitous
computing. Tali campi sono caratterizzati dalla specializzazione
dei calcolatori a risolvere compiti specifici. In questo modo è
possibile produrre questi calcolatori riducendone significativamente
le dimensioni e il costo, potendoli così immergere all'interno di
un ambiente. In particolare, focalizzandosi sul problema del
rilevamento degli stati di attenzione
[Kasderidis et al., 2003]
, è stato sviluppato
un prototipo per il riconoscimento dello stato di attenzione di
un guidatore di autovettura sulla base di segnali biologici
[Apolloni et al., 2004; Apolloni et al., 2004; Apolloni et al., 2003; Apolloni et al., 2003; Apolloni et al., 2003]
.
Durante lo svolgimento del progetto di ricerca PHYSTA
(Principled Hybrid Systems: Theory and Applications, finanziato
dalle UE nel quarto programma quadro all'interno della tematica TMR
tra il 1998 e il 2000), il modello di inferenza algoritmica
descritto in
[Apolloni et al., 2006; Malchiodi, 2000]
è stato applicato al
problema di classificazione automatica delle emozioni sulla
base di segnali audio-visuali
[Apolloni et al., 2004; Apolloni et al., 2002]
. I risultati scientifici ottenuti
sono stati presentati durante una scuola internazionale di
apprendimento computazionale all'interno del medesimo
progetto.
La disponibilità di circuiti hardware in grado di elaborare
direttamente dei dati al fine di sintetizzarli tramite stimatori
permette di ridurre notevolmente i tempi di calcolo. Il loro uso
impone però una serie di vincoli legati essenzialmente
all'architettura dei circuiti stessi. All'interno di questo
ambito si è applicato il modello di inference among gossips,
sviluppato in
[Malchiodi, 1996]
, al
fine di ottenere una famiglia di stimatori per popolazioni
Bernoulliane implementabile direttamente su schede pRAM
[Apolloni et al., 1997]
. Lo stesso modello è
stato applicato in
[Apolloni et al., 2013]
allo
studio dello scambio di informazioni nelle reti sociali.