Web information retrieval
(a.a. 2006/2007)
Docente
- Dott. Stefano Mizzaro
mizzaro@dimi.uniud.it
http://www.dimi.uniud.it/mizzaro/
Crediti
6 CFU
Finalità del corso
Il corso mira a introdurre le tematiche principali dell'information retrieval (IR), una disciplina importante storicamente e che ha ricevuto un forte impulso in seguito all'avvento del Web. Infatti, dopo la posta elettronica, l'uso di un motore di ricerca è oggi la seconda attività degli utenti del Web, e svariati utenti del Web usano un motore di ricerca come Google come modalità principale di accesso alla rete. Oltre alle tematiche assodate dell'IR classico, vengono presentate quelle, più recenti, specifiche del mondo Web. Vengono discussi sia argomenti di base sia le correnti linee di ricerca e le tendenze future.Programma del corso
Il corso è diviso in tre parti:- Information Retrieval classico: modelli concettuali della ricerca d'informazioni, modelli concettuali e formali dei sistemi d'IR, progetto e implementazione di un sistema d'IR, strutture dati e algoritmi di indicizzazione e ricerca, interfacce utente per l'IR, la problematica della valutazione dei sistemi d'IR.
- Web Information Retrieval: modelli del Web (forma e dimensioni del grafo del Web, cenni all’analisi delle reti sociali e alle reti piccolo mondo), analisi dei link e della connettività, iperlink e crawling, IR multimediale, meta-motori, progetto e implementazione di un motore di ricerca per il Web, biblioteche digitali.
- Tematiche avanzate: IR parallelo e distribuito, ricerca d'informazioni tramite dispositivi mobili e su reti peer-to-peer, problemi fondazionali del settore (ad es., i concetti di informazione e pertinenza), sistemi per il filtraggio d'informazioni, clustering, banche dati specialistiche (ad es., mediche), ecc. Queste tematiche avanzate verranno trattate in forma di attività seminariale, che potrà essere svolta, opzionalmente, dagli studenti.
Modalità d'esame
Orale. Sono previste anche attività, opzionali e a scelta dello studente ma caldamente consigliate, che portano a un esame semplificato e a una votazione superiore: seminari svolti durante il corso o semplici progetti concordati con il docente. Al corso è possibile affiancare il laboratorio: in tal caso l'attività progettuale è più impegnativa.Testi consigliati
R. Baeza-Yates e B. Ribeiro-Neto, Modern Information Retrieval, Addison Wesley, 1999. ISBN: 020139829X.R. Belew, Finding Out About - A Cognitive Perspective on Search Engine Technology and the WWW, Cambridge University Press, 2000, ISBN: 0-521-63028-2.
R. Korfhage, Information Storage and Retrieval, Wiley, 1997, ISBN: 0471143383.
Molti degli argomenti trattati non sono disponibili su testi, ma solo su articoli scientifici. A lezione verranno comunicati eventuali altri testi e verrà segnalato o fornito altro materiale (tutti i lucidi delle lezioni, pagine Web, dispense, altri testi di riferimento, articoli scientifici, ecc.). Aggiornato il 27/07/2006



