From BIMIB
0910 - Bioinformatica (LM)
Questa è la home page del corso "Bioinformatica" del secondo anno della laurea magistrale in informatica - anno accademico 2009/10.
Il docente di riferimento di questo corso è Prof. Paola Bonizzoni.
Avvisi
- Nella sezione Modalità d'esame sono stati pubblicati i testi del primo homework.
Orario
Lezione:
- Martedì, ore 11.30-13.30, aula U14-T024;
- Giovedì, ore 9.30-11.30, aula U14-T024.
Programma
Il programma di riferimento comprende le tematiche seguenti.
- Introduzione alla biologia computazionale: motivazioni e metodologie.
- L'importanza del confronto e dell'analisi di sequenze biologiche.
- Tecniche di allineamento di sequenze (allineamento globale e locale) e di allineamento multiplo.
- Algoritmi per l’allineamento di sequenze nella predizione della struttura di un gene (splicing alternativo).
- La ricerca di motivi in sequenze biologiche.
- Il problema generale del matching esatto.
- Gli alberi suffisso e la loro applicazione nella ricerca di ripetizioni nelle sequenze biologiche.
- Lo studio delle variazioni (mutazioni) geniche nella popolazione. Alberi evolutivi.
- Ricostruzione della storia evolutiva di specie con alberi: metodi principali.
- L'aplotipizzazione di individui: metodi combinatori basati sul modello coalescente e il criterio di massima parsimonia.
- Internet e il Progetto Genoma Umano. Le banche dati e il software per l’analisi del genoma.
Lezioni svolte
- Introduzione al corso e al problema di analisi e confronto di sequenze (6 ottobre, 2 ore).
- Confronto di sequenze con distanza di edit. Allineamento di due sequenze. Ricorrenza di programmazione dinamica dell’allineamento di 2 sequenze (8 ottobre, 2 ore).
- Allineamento globale di due sequenze con banda (13 ottobre, 2 ore).
- Esercizi di allineamento globale, locale e a banda di due sequenze: calcolo del costo ottimo tramite programmazione dinamica. (15 ottobre, 2 ore).
- Allineamento locale e semiglobale. (20 ottobre, 2 ore).
- Biologia molecolare: introduzione di base per informatici. (22 ottobre, 2 ore).
- Allineamento globale di tre sequenze con costo Sum of Pairs. (27 ottobre, 2 ore).
- Esercitazione sulle banche dati biologiche. (29 ottobre, 2 ore).
- Ricostruzione di alberi filogenetici mediante metodi basati su distanze e su caratteri. (10 novembre, 2 ore).
- Filogenesi perfetta su caratteri binari. (12 novembre, 2 ore).
- Algoritmi di ricostruzione di alberi filogenetici basati sulle distanze. (17 novembre, 2 ore).
- Inferenza di aplotipi con il modello della filogenesi perfetta (19 novembre, 2 ore).
- Problemi computazionali di inferenza di aplotipi basati su pedigree: consistenza mendeliana e ricostruzione di configurazioni di aplotipi in assenza di ricombinazioni (22 e 24 novembre, 2+2 ore).
- Problema di pattern matching e Suffix Tree (26 novembre, 2 ore).
- Suffix Tree: algoritmo di costruzione ingenuo, exact string matching tra un pattern e un testo. Suffix Tree generalizzato: longest common substring tra due sequenze (1 dicembre, 2 ore).
- Riarrangiamento genomico per inversioni e trasposizioni (3 dicembre, 2 ore).
- Algoritmo 2-approssimante per l'ordinamento di genomi per inversioni (10 dicembre, 2 ore).
- Problema di predizione della struttura in esoni e introni di un gene e dello Splicing Alternativo (15 dicembre, 2 ore).
- Esercitazione su ASPic (predizione della struttura di un gene) e su Phylip (ricostruzione di filogenesi) (17 dicembre, 2 ore).
Modalità di esame
I testi del primo homework sono disponibili qui: [1], [2], [3]. La consegna è fissata per il giorno 24 novembre 2009.
Materiale del corso
- Le lezioni finora svolte sono recuperabili al link.
- "Biologia molecolare: introduzione di base per informatici", lezione tenuta dalla dott.ssa Renata Tisi (slides).
- "Combinatorial methods in bioinformatics: the haplotyping problem" (slides).
- Esercitazione di laboratorio sul software ASPic:
- Esercitazione di laboratorio sul software Phylip: testo e file dati.