Università degli Studi di Pavia

Dipartimento di Studi Umanistici

HomeDidatticaCorsi › Linguistica computazionale (c.p.)

Linguistica computazionale (c.p.)

Docenti:
Prodanof Irina
Anno accademico:
2005/2006
Decreto Ministeriale:
509/99
Descrizione:
Trattamento Automatico del Linguaggio Naturale (TALN): modelli e tecniche per l'annotazione di corpora, e per l'organizzazione ed il reperimento di informazione in documenti scritti e parlati

Programma

Il ciclo di seminari si propone di discutere alcuni temi attuali nel Trattamento Automatico del Linguaggio Naturale (TALN). Negli ultimi anni, la Linguistica e la Linguistica Computazionale vengono spesso chiamate a proporre soluzioni sul piano teorico ed applicativo, in una societa' in cui la comunicazione e la circolazione su larga scala dell'informazione diventano centrali: 1. Risorse Linguistiche. Annotazione a vari livelli di analisi (trascrizione, fonetico, morfologico, sintattico, semantico, dialogico, pragmatico). Standards, "riutilizzo" ed adeguamento delle risorse alle necessita' dell'utente. XML: uno standard per la descrizione e l'interscambio di risorse linguistiche. 2. Presentazione di alcune Risorse Linguistiche (lessicali e testuali) e di strumenti per la creazione, l'aggiornamento e l'interrogazione. (Wordnet, Framenet, PAROLE/SIMPLE, Tree-bank, corpora annotati, corpora paralleli, ecc.). 3. Ontologie 4. Tecniche per il reperimento di informazione: dal reperimento, in vaste collezioni, dei documenti pertinenti, verso l'estrazione di informazione dal contenuto di un documento. (Information Retrieval vs. Information Extraction). 5. Sistemi di Domanda/Risposta non vincolati al dominio (Open Domain Question-Answering) 6. Tecniche per la disambiguazione semantica.

Bibliografia

Il presente programma e' solo una serie di proposte ed e' soggetto a cambiamenti, integrazioni e personalizzazioni a seconda degli interessi specifici degli studenti. Per chi scegliesse di seguire questo corso e' consigliato avere seguito prima uno di questi corsi: Linguistica Computazionale (corso base), Informatica di Base (Prof. Vito Pirelli), Laboratorio (Prof. Andrea Sanso'). Letture consigliate (per i punti 1 e 2): Tony M Enery & Andrew Wilson : Corpus Linguistics, Edimburgh University Press, 2nd Edition, 2001 Biber, Conrad & Reppen: Corpus Linguistics: Investigating Language Structure and Use, Cambride University Press, 1998 A.Lenci, S. Montemagni & V. Pirelli: Testo e Computer. Elementi di linguistica computazionale, Carocci editore, 2005

Elenco appelli e prove

Nessuna prova presente

Dipartimento di Studi Umanistici

Università degli Studi di Pavia
Segreteria amministrativa: Piazza Botta, 6 - 27100 Pavia
Segreteria didattica: Corso Strada Nuova, 65 - 27100 Pavia
Sezioni del Dipartimento
Email: webmaster.lettere (at) unipv.it