Anno Accademico 2023-24
Titolo: Intelligenza Artificiale Multimodale: applicazione alla Classificazione d'Immagine, Segmentazione e Analisi NLP
Docenti: Curzio Basso, Alice Fantazzini
Semestre: II
Crediti 3 (24 ore)
Modalità di svolgimento: lezione frontale e laboratorio (Python)
Programma: L'insegnamento è diviso in moduli:
Fondamenti di Python per Applicazioni di Machine Learning
Questo modulo introduce gli studenti ai fondamenti di Python necessari per lavorare con tecniche di machine learning. Saranno coperti concetti di base come la manipolazione di array con NumPy, la preparazione e la visualizzazione dei dati e l'utilizzo di librerie come scikit-learn per la creazione e la valutazione di modelli di machine learning. Gli studenti acquisiranno competenze essenziali per la manipolazione dei dati e la costruzione di modelli di machine learning in Python.
Classificazione di Immagini
Questo modulo copre l'applicazione di tecniche di intelligenza artificiale per la classificazione delle immagini. Gli studenti impareranno come utilizzare reti neurali per classificare ed estrarre automaticamente le caratteristiche discriminanti dalle immagini (feature extraction). Dopo l'estrazione delle feature, verranno applicati algoritmi di machine learning tradizionali per la classificazione delle immagini. Questo approccio combina la capacità delle reti deep di estrarre feature rilevanti con l'efficacia dei modelli di machine learning per la classificazione.
Segmentazione di Immagini con Reti Convoluzionali
Questo modulo si focalizza sull'elaborazione delle immagini utilizzando reti neurali convoluzionali (CNN). Verrà spiegato come utilizzare le CNN per la segmentazione delle immagini, un'applicazione comune nell’ambito della computer vision. Gli studenti acquisiranno familiarità con il framework di deep learning Keras per implementare modelli di segmentazione di immagini.
Applicazioni di NLP per l'Analisi di Testi con Large Language Models
Questo modulo si concentra sull'elaborazione del linguaggio naturale (NLP) utilizzando modelli di linguaggio di grandi dimensioni (da OpenAI, Hugging Face, …). Gli studenti impareranno come utilizzare questi modelli per attività di analisi del testo avanzate, tra cui lo sviluppo di una pipeline automatica per interrogare documenti PDF.
Modalita' d'esame: A scelta tra seminario o laboratorio