Dipartimento di Ingegneria e architettura Ingegneria dell’intelligenza artificiale e della sicurezza informatica Linguistica computazionale e Elaborazione del parlato L-LIN- /01 – ING-INF/05 (9 CFU) – (Ingegneria dell’Intelligenza Artificiale e della Sicurezza Informatica) PdS 2023-2024 – II anno

Home Didattica Corsi di Laurea triennali e Magistrali Ingegneria dell’intelligenza artificiale e della sicurezza informatica (Ingegneria dell’Intelligenza artificiale e della Sicurezza informatica) Frequentare il corso (Ingegneria dell’Intelligenza Artificiale e della Sicurezza Informatica) PdS 2023-2024 Linguistica computazionale e Elaborazione del parlato L-LIN- /01 – ING-INF/05 (9 CFU) – (Ingegneria dell’Intelligenza Artificiale e della Sicurezza Informatica) PdS 2023-2024 – II anno
Insegnamento Linguistica Computazionale e Elaborazione del parlato
CFU 9
Settore Scientifico Disciplinare L-LIN/01 ING-INF/05
Metodologia didattica

Lezioni Frontali

Nr. ore di aula 54
Nr. ore di studio autonomo 171
Mutuazione no
Annualità II
Periodo di svolgimento II semestre
Docente Ruolo SSD docente
Sabato Marco Siniscalchi PO ING-INF/05
Sandra Villata RTD-B L-LIN/01
* PO (professore ordinario), PA (professore associato), RTD (ricercatore a tempo determinato), RU (Ricercatore a tempo indeterminato), DC (Docente a contratto).
Propedeuticità Machine Learning
Sede delle lezioni Dipartimento di Ingegneria e Architettura
N Nome del modulo Docente Durata in ore
1 Elaborazione del Parlato Marco Sabato Siniscalchi 36
2 Linguistica Computazionale Sandra Villata 18
Orario delle lezioni

L’orario delle lezioni sarà pubblicato sulla pagina web del sito Unikore:

https://gestioneaule.unikore.it/agendaweb_unikore/index.php?view=easycourse&_lang=it

Obiettivi formativi

L’insegnamento ha lo scopo di fornire una solida introduzione alla linguistica computazionale e alla elaborazione del parlato, due branche fondamentali dell’intelligenza artificiale. Lo scopo di questo corso è quello di fornire una descrizione teorica valida e tecnicamente accurata dei moderni sistemi di elaborazione del parlato con tecniche statistiche e di machine learning.

Nel modulo di linguistica computazionale, il corso tratterà le espressioni regolari e i concetti base di morfologia. Verranno anche introdotti elementi della teoria acustico-fonetiche – unità di base dei suoni del parlato sono caratterizzate in relazione alle loro proprietà linguistiche e misure acustiche. Si studierà il processo di produzione del parlato, la rappresentazione del parlato nei domini del tempo e della frequenza, i principali suoni e le principali caratteristiche (feature) del parlato (vocali, consonati) e i sistemi di trascrizione fonetica. Infine, accenni sui modelli probabilistici per la pronuncia e modelli n-gram.
Nel modulo di elaborazione del parlato, il corso tratterà le rappresentazioni di base del parlato (e.g., forme d’onda, short-time-fourier-transform (e la sua inversa), autocorrelazione etc.), le operazioni di pre-processing come pre-enfasi e speech enhancement, gli strumenti di modellazione nell’elaborazione del parlato. Si introdurranno anche i metodi di valutazione delle tecniche per l’elaborazione del parlato (oggettive, soggettive) e le tecniche di analisi del parlato (stima della frequenza fondamentale). Si studieranno anche le tecniche di elaborazione del parlato, come ad esempio, voice activity detection, speech enhancement, speaker recognition, speech synthesis etc.

L’obiettivo del corso è fornire agli studenti solide basi teoriche che consentano loro di selezionare, applicare e valutare diversi metodi per applicazioni dell’elaborazione del parlato nel mondo reale, ad esempio nel campo medico o della sicurezza informatica. Gli studenti acquisiranno anche le competenze richieste per ideare nuovi approcci basati sui framework che verranno presentati durante le lezioni. Il corso prevede esercitazioni che consentiranno agli studenti di esercitare le nozioni teoriche sui dati reali utilizzando moderni framework di programmazione ampiamente utilizzati sia dalle comunità di ricerca che dalle aziende.

Contenuti del Programma
N. Argomento tipologia Durata
1 Introduzione al corso Frontale 1h
2 Produzione del parlato e proprietà acustiche Frontale 3h
3 Percezione del parlato Frontale 2h
4 Strutture linguistiche del parlato (foni, fonemi etc.) Frontale 5h
5 Espressioni Regolari Frontale 2h
4 Morfologia Frontale 2h
5 N-Gram Frontale 4h
6 Rappresentazione di base del parlato (waveform, stft etc) Frontale 6h
7 Pre-processing del segnale Frontale 3h
8 Strumenti di modellazione del parlato (linear regression, vector quantization, neural networks, gaussian mixture models, NMF, Hidden Markov Model, Vocoder) Frontale 6h
9 Valutazione dei modelli (soggettive e oggettive) Frontale 2h
10 Analisi del Parlato (stima della frequenza fondamentale) Frontale 2h
11 Voice activity detection e Wake-work keyword spotting Frontale 2h
12 Speaker Recognition e Verification Frontale 2h
13 Speaker Diarization Frontale 1h
  Speech Synthesis Frontale 2h
11 Speech Enhancement Frontale 4h
13 Automatic Speech Recognition Frontale 5h
Risultati di apprendimento (descrittori di Dublino)

Alla fine del corso, gli studenti dovranno aver conseguito le seguenti abilità, conoscenze e competenze:

Conoscenza e capacità di comprensione: L’insegnamento si propone di completare la formazione di base necessaria per la progettazione sistematica e strutturata di un sistema di machine learning. Lo studente saprà comprendere le motivazioni teoriche alla base dei diversi approcci di classificazione, regressione e clustering le loro principali proprietà e dominio di applicazione ei loro limiti.

Conoscenza e capacità di comprensione applicate: Lo studente alla fine del corso acquisirà una buona conoscenza dei principali principi di base dell’apprendimento automatico statistico applicato al riconoscimento e alla classificazione di pattern. Acquisirà inoltre le conoscenze delle principali tecniche di classificazione, inclusi i modelli gaussiani lineari generativi e gli approcci discriminativi basati sulla regressione logistica, le support vector machine e le reti neurali artificiali. Inoltre saprà distinguere tra modelli parametrici e non parametrici. Sarà in grado di implementare i diversi algoritmi utilizzando framework di programmazione diffusi (Python) e saprà applicare metodi diversi a compiti reali, valutarne criticamente l’efficacia e analizzare quali strategie sono più adatte alle diverse applicazioni. Infine saprà trasferire le conoscenze e le capacità acquisite per risolvere nuovi problemi di classificazione e regressione, sviluppando nuovi metodi basati sui framework che verranno discussi durante l’insegnamento.

Autonomia di giudizio: Lo studente sarà in grado di valutarne la qualità di una soluzione in termini di semplicità, leggibilità, efficienza e possibilità di riutilizzo. L’autonomia di giudizio sarà valutata esaminando le soluzioni proposte dagli studenti a problemi di media complessità.
Abilità comunicative: Lo studente acquisirà la capacità di comunicare ed esprimere problematiche inerenti all’oggetto dell’attività formativa utilizzando una terminologia appropriata e corretta.

Capacità di apprendere: Lo studente acquisirà la capacità per apprendere i processi di analisi dei requisiti di una proposta progettuale. Inoltre avrà gli strumenti per approfondire autonomamente le conoscenze di base impartite durante il corso.

Testi per lo studio della disciplina

Testo principale: X. Huang, A. Acero, and H.-W. Hon, Spoken Language Processing – A guide to Theory, Algorithm, and System Development. Prentice Hall PTR, Upper Saddle River, NJ, United States

Materiale didattico a disposizione degli studenti:
– Le diapositive presentate durante il corso (caricate settimanalmente sulla piattaforma Unikorefad)
– Esercizi svolti in classe

Testi di riferimento:
– X. Huang, A. Acero, and H.-W. Hon, Spoken Language Processing – A guide to Theory, Algorithm, and System Development. Prentice Hall PTR, Upper Saddle River, NJ, United States.
– N. Hewlett, J. Back. An Introduction to the Science of Phonetics. Routledge Taylor & Francis Group.

Testi di approfondimento:
– D. Jurafsku and J. H. Martin, Speech and Language Processing – An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. Prentice Hall PTR, Upper Saddle River, NJ, United States
– Language Files: Materials for an Introduction to Language and Linguistics, 13th Edition
– P. Maturi, 2006. I suoni delle lingue, i suoni dell’italiano. Nuova introduzione alla fonetica. Il Mulino.

Metodi e strumenti per la didattica

I metodi didattici prevedono lezioni frontali. Tutti gli strumenti utili al corso verranno forniti in aula e messi a disposizione dello studente.

La frequenza dell’insegnamento è fortemente consigliata ma non obbligatoria.

Modalità di accertamento delle competenze

L’esame consisterà in una prova scritta che verte sui contenuti dell’insegnamento. La prova si compone di domande a risposta chiusa, domande che richiedono sintetiche riposte aperte sui contenuti trattati durante l’insegnamento, le letture assegnate, ed i testi di riferimento, ed esercizi che richiedono di applicare le conoscenze acquisite durante l’insegnamento. I punti associati ad ogni domanda saranno chiaramente indicati nella prova d’esame accanto ad ogni domanda. La somma dei punti delle domande dei due moduli (linguistica computazionale ed elaborazione del parlato) sarà uguale a 32 per ogni modulo, per un totale di 64 punti. Il voto finale sarà calcolato attraverso una media ponderata tra i due moduli che rifletterà i diversi CFU di ognuno. L’esame si considera superato con una votazione minima di 18. La tabella di conversione dei punti in 30esimi è la seguente:

Punti 64 63 62 61 60 59 58 57 56 55 54 53 52 51 50 49
Voto 30 e lode 30 e lode 30 e lode 30 e lode 30 30 29 29 28 28 27 27 26 26 25 25
Punti 48 47 46 45 44 43 42 41 40 39 38 37 36 35 <35             
Voto 24 24 23 23 22 22 21 21 20 20 19 19 18 18 esame non superato  

 

Date di esame

Le date di esami saranno pubblicate nell’agenda web del sito Unikore:

https://gestioneaule.unikore.it/agendaweb_unikore/index.php?view=easytest&_lang=it

Modalità e orario di ricevimento

Il ricevimento è in presenza. Il ricevimento avverrà dopo la fine dell’orario delle lezioni. Si prega di contattare il docente con sufficiente anticipo per fissare il ricevimento.

Indietro