Dario Malchiodi — Università degli Studi di Milano

In [Malchiodi e Pedrycz, 2013; Malchiodi, 2019a] è stato proposto un algoritmo di apprendimento per insiemi fuzzy a partire da dati etichettati con i rispettivi gradi di appartenenza. Tale algoritmo è stato applicato al mining di assiomi nell'ambito del Web semantico [Malchiodi e Tettamanzi, 2018] e alla selezione di esempi negativi per problemi di bioinformatica [Frasca e Malchiodi, 2017; Frasca e Malchiodi, 2016] . L'approccio proposto è stato esteso in [Cermenati et al., 2020] all'induzione simultanea di più insiemi fuzzy e in [Malchiodi e Zanaboni, 2019] all'apprendimento di shadowed set.

in collaborazione con Prof. Zanaboni (Università degli Studi di Milano), Prof. Pedrycz (University of Alberta)

in collaborazione con Prof. Anna Maria Zanaboni, Prof. Marco Frasca, Prof. Massimo Walter Rivolta (Università degli Studi di Milano)

La conoscenza indotta tramite tecniche di machine learning è spesso codificata e memorizzata in modo distribuito all'interno dei modelli appresi a partire dai dati. Ciò può rendere difficile l'interpretazione qualitativa dei risultati ottenuti, oltre a costituire un potenziale problema in caso di risorse limitate in termini di banda e capacità di memorizzazione. Una possibile soluzione a questi problemi consiste nel ridurre lo spazio necessario per memorizzare i suddetti modelli dopo la fase di apprendimento. Nell'ambito del progetto PRIN Multicriteria Data Structures and Algorithms: from compressed to learned indexes, and beyond vengono studiate tecniche di compressione per reti neurali apprese tramite algoritmi di deep learning [Marinò et al., 2021a] . La loro implementazione è descritta in [Marinò et al., 2021] .

in collaborazione con Prof. Frasca (Università degli Studi di Milano)

La ricerca di potenziali assiomi all'interno di insiemi di formule è un problema particolarmente oneroso dal punto di vista computazionale. La soluzione di indurre tali assiomi sulla base di formule etichettate con una misura di bontà precalcolata a partire da una base di conoscenza nell'ambito del Web semantico è stata affrontata utilizzando algoritmi di apprendimento per insiemi fuzzy [Malchiodi e Tettamanzi, 2018] e tecniche di regressione basate su metodi kernel [Malchiodi et al., 2018] . In [Malchiodi et al., 2020] viene analizzata la dipendenza di questo problema rispetto agli algoritmi di apprendimento utilizzati e alle tecniche di riduzione della dimensionalità impiegate per codificare gli assiomi tramite vettori numerici.

in collaborazione con Prof. Da Costa Pereira, Prof. Tettamanzi (Université de la Côte d'Azur)

L'applicazione di metodi di appredimento supervisionato in bioinformatica richiede di selezionare tra i dati non etichettati positivamente quelli che rappresentano esempi negativi affidabili e non semplicemente entità su cui non sono stati fatti esperimenti. In [Frasca e Malchiodi, 2017; Frasca e Malchiodi, 2016] tale problema di selezione dei negativi è stato affrontato utilizzando un ranking basato su funzioni di appartenenza a insiemi fuzzy, mentre in [Frasca et al., 2017a; Boldi et al., 2018] è stata proposta una codifica dei dati a disposizione che faciliti il processo di selezione dei negativi nel problema della predizione di funzionalità proteiche. Infine, in [Frasca et al., 2019] una procedura simile è stata applicata al problema della prioritizzazione dei geni.

in collaborazione con Prof. Frasca (Università degli Studi di Milano)

[Casiraghi et al., 2020] e [Esposito et al., 2021] descrivono l'applicazione di tecniche di apprendimento automatico al problema della previsione del grado di gravità del COVID-19 dei pazienti che si presentano al pronto soccorso.

in collaborazione con Prof. Valentini (Università degli Studi di Milano) Prof. Casiraghi (Università degli Studi di Milano) Prof. Frasca (Università degli Studi di Milano)

Sono state adattate tecniche di machine learning e di analisi statistica dei dati a problemi in ambito veterinario e forense. In particolare, [Galizzi et al., 2021] e [Bagardi et al., 2021] descrivono l'applicazione di tecniche statistiche al fine di classificare l'incidenza di fattori cardiovascolari nel decesso di cani sottoposti a specifica terapia, mentre [Casali et al., 2021] discute uno studio pilota sull'applicazione di algoritmi di classificazione per la predire il tipo di veicolo coinvolto nell'investimento di un pedone.

in collaborazione con Prof. Zanaboni (Università degli Studi di Milano)

I modelli di apprendimento automatico hanno come punto di partenza un campione etichettato i cui dati sono trattati in modo omogeneo (cioè hanno la medesima importanza). In [Malchiodi, 2008] è stato introdotto il modello più generale di apprendimento basato su rilevanza, in cui è possibile associare a ognuno dei dati disponibili una quantificazione numerica della sua importanza relativa rispetto ai dati rimanenti. Tale modello è stato applicato al problema della classificazione tramite Support Vector Machine, derivando gli algoritmi di classificazione sia nella versione lineare [Apolloni e Malchiodi, 2006a] che in quella basata su kernel [Apolloni et al., 2007c] . Una prima analisi teorica di queste applicazioni è stata proposta in [Apolloni et al., 2007d] , affiancata da un'analisi sperimentale in [Malchiodi, 2009] , mentre la sua applicazione a problemi di natura bioinformatica è descritta in [Malchiodi et al., 2010] . Un approccio simile è stato inoltre applicato al problema della regressione in [Apolloni et al., 2010; Malchiodi et al., 2009c; Apolloni et al., 2005b] e all'apprendimento da esempi sbilanciati in [Malchiodi, 2013b] .

Sono stati progettati, implementati e analizzati differenti tipi di algoritmi di apprendimento. In particolare, [Malchiodi e Legnani, 2014] propone un'estensione di algoritmi di classificazione basati su vettori di supporto che permette di lavorare sia con dati parzialmente etichettati, sia con etichette incerte, mentre [Malchiodi e Pedrycz, 2013] introduce un algoritmo di apprendimento per le funzioni di appartenenza di insiemi fuzzy, specializzato in [Malchiodi e Zanaboni, 2019] all'induzione di shadowed set.

Relativamente alla didattica a livello universitario sono stati pubblicati un manuale per l'utilizzo di software di calcolo automatico e un eserciziario di Sistemi operativi [Malchiodi, 2007; Malchiodi, 2015] . A un livello più divulgativo, [Monga et al., 2017] è un volume incentrato sulla figura di Alan Turing e [Malchiodi, 2019a] descrive potenziali sviluppi futuri delle metodologie basate su insiemy fuzzy.