Università degli Studi di Pavia

Dipartimento di Studi Umanistici

HomeDidatticaCorsi › Linguistica computazionale (c.p.)

Linguistica computazionale (c.p.)

Corsi di laurea:
Linguistica teorica, applicata e delle lingue moderne
Docenti:
Prodanof Irina
Anno accademico:
2009/2010
Codice corso:
501165
Crediti formativi:
6
Ambito:
L-LIN/01 GLOTTOLOGIA E LINGUISTICA
Decreto Ministeriale:
270/04
Ore di lezione:
30
Periodo:
4º trimestre

Modalità

esame orale con, in aggiunta, la presentazione di una ricerca personale su un argomento in margine al tema del corso.

Prerequisiti

Per chi scegliesse di seguire questo corso e’ consigliato avere seguito prima almeno uno di questi corsi: Linguistica Computazionale (corso base), Laboratorio (Prof. Andrea Sanso’), o un corso equivalente.

Programma

Proposta 1.

Analisi del discorso

  1. Teorie e modelli computazionali per la strutturazione del discorso.
  2. Tecniche per la risoluzione dell’anafora; anafora associativa (bridging anafora).
  3. Anafora eventiva e testualita’.
  4. Soggettivita’ nel discorso: punti di vista, opinioni. Attribuzioni.
  5. Schemi di annotazione. Penn Discourse Bank

Penn Discourse Treebank, http://www.seas.upenn.edu/~pdtb/

Bonnie Webber, Matthew Stone, Aravind Joshi and Alistair Knott. Anaphora and Discourse Structure. Computational Linguistics, 29(4), pp. 545-587, 2003.

Bonnie Webber. Computational Perspectives on Discourse and Dialogue. In Deborah Schiffrin,

Deborah Tannen and Heidi Hamilton (eds.), The Handbook of Discourse Analysis, Blackwell Publishers Ltd..

Bonnie Webber, Aravind Joshi, et alii, A short Introduction to the Penn Discourse Treebank, http://www.cis.upenn.edu/~elenimi/nodalida.pdf.

Proposta 2.

Open Domain Question-Answering – sistemi domanda-risposta, non ristretti al dominio, per la ricerca dell’informazione su web.

Negli ultimi anni, la Linguistica e la Linguistica Computazionale vengono spesso chiamate a proporre soluzioni sul piano teorico ed applicativo, in una societa’ in cui la comunicazione e la circolazione su larga scala dell’informazione diventano centrali.

Il ciclo di lezioni si propone di discutere un tema attuale nel Trattamento Automatico del Linguaggio Naturale (TALN), quello del reperimento di informazione fattuale su web

§ delimitazione del problema: OD-QA alla frontiera tra ricerca documentaria ed estrazione di informazione.

§ Architettura di un sistema di Document Retrieval.

  1. Tipologia dei sistemi di domanda-risposta. Approcci precedenti. Complessita’ del problema: tecnologie necessarie per la costruzione di un sistema di OD-QA
  2. I moduli di un sistema di OD-QA
  3. Risorse lessicali impiegate in OD-QA. Vantaggi e limiti dell’utilizzo di lessici semantici in OD-QA. Sfruttamento delle gerarchie di WordNet.
  4. Identificare eventi e relazioni temporali: importanza ed applicazioni in OD_QA. Dotare i sistemi di OD-QA della capacita’di rispondere a domande che presuppongono inferenze temporali. Metonimia logica. Problemi generali.
  5. TimeML. Concetti di base: tempo e aspetto, classi aspettuali (ontologia lessicale), referenza temporale e ragionamento, relazioni per ancorare eventi a tempi e ordinare gli eventi.Aspetto lessicale: Aktiosarten. Tipi di eventi.
  6. Referenza temporale nel testo: diretta (espressioni temporali), indiretta (tramite tempo e aspetto), con segnalatori. Tempo come anafora (le relazioni di Reichenbach).
  7. Ragionare su tempo ed eventi: la logica temporale.
  8. TimeML: componenti del linguaggio di annotazione. Strumenti per l’annotazione.
  9. Inferenza temporale.
  10. La metonimia logica.: combinazioni sistematiche, restrizioni contestuali. Uso del Lessico generativo di Pustejovsky (qualia structure), per la risoluzione della metonimia logica.

Bibliografia

Mani I., Pustejovsky J., Geisauskas R., The Language of Time. Oxford University Press, 2005

Pustejovsky, J., J. Castaño, R. Ingria, R. Saurí, R. Gaizauskas, A. Setzer and G. Katz. 2003.

TimeML: Robust Specification of Event and Temporal Expressions in Text. IWCS-5, Fifth International Workshop on Computational Semantics.

James Pustejovsky, Patrick Hanks, Roser Saurí, Andrew See, Robert Gaizauskas, Andrea Setzer, Dragomir Radev, Beth Sundheim, David Day, Lisa Ferro and Marcia Lazo. 2003. The TIMEBANK Corpus. /Proceedings of Corpus Linguistics 2003/: 647-656.

Harabagiu S., Moldovan D., Pasca M., Mihalcea R., Surdeanu M., Bunescu R., Girju R., Rus V. and Morarescu P., The Role of Lexico-Semantic Feedback in Open-Domain Textual Question-Answering, in Proceedings of the 39th Annual Meeting of the Association for Computational Linguistics (ACL-2001), July 2001, Toulouse France, pages 274-281.

Harabagiu S., Pasca M., Maiorano S., Experiments with Open-Domain question Answering, Proceedings of COLING200.(Harabagiu et al. 2000a)

Il presente programma e’ soggetto a cambiamenti, integrazioni e personalizzazioni a seconda degli interessi specifici degli studenti.

Gli studenti sono invitati a contattare il docente entro il 31.12.2009 per stabilire il tema scelto per il corso.


Elenco appelli e prove

Nessuna prova presente

Dipartimento di Studi Umanistici

Università degli Studi di Pavia
Segreteria amministrativa: Piazza Botta, 6 - 27100 Pavia
Segreteria didattica: Corso Strada Nuova, 65 - 27100 Pavia
Sezioni del Dipartimento
Email: webmaster.lettere (at) unipv.it