Les tècniques de model.lització estadística constitueixen un dels pilars fonamentals de l'àmbit del suport a la presa de decisions, i l'anàlisi intel.ligent de dades
En aquest curs es veuran els principals models multivariants predictius (model lineal general), i descriptius (anàlisi multivariant i clustering), així com nocions de disseny d'experiments que seran útils en la configuració dels conjunts de dades d'entrenament i validació dels models, no només per aquesta assignatura, sinó també per les d'aprenentatge automàtic que també es veuen en el grau. S'inclou en el programa de l'assignatura eines de modelització dinàmica per dades amb caràcter temporal.
Les eines vistes en aquesta assignatura complementaran les vistes a aprenentatge automàtic i seran input imprescindible per les assignatures de la matèria anàlisi intel·ligent de dades i sistemes intel·ligents de suport a la presa de decisions.
Professorat
Responsable
- Jordi Cortés Martínez (jordi.cortes-martinez@upc.edu)
Altres
- Dante Conti (dante.conti@upc.edu)
- Karina Gibert Oliveras (karina.gibert@upc.edu)
Hores setmanals
Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6
Competències
Transversals
Bàsiques
Específiques
Genèriques
Objectius
-
Dissenyar jocs de proves i d'entrenament solvents i orientats a objectius
Competències relacionades: CG8, CT8, CB3, CE09, -
Identificar quin model predictiu és adequat per un problema concret i unes dades concretes
Competències relacionades: CG4, CE01, CE09, CE20, -
Construir i interpretar models vàlids per l'evolució temporal d'una variable numèrica
Competències relacionades: CG4, CT3, CT4, CE01, CE09, CE20, -
Identificar classes en un conjunt de dades i saber-les validar i interpretar conceptualment
Competències relacionades: CG2, CG4, CT3, CT4, CE01, CE09, CE20, -
Caracteritzar les relacions multivariants en un conjunt de dades amb tècniques d'anàlisi factorial
Competències relacionades: CG4, CT3, CT4, CE01, CE09, CE20, -
Poder fer l'anàlisi bàsica no supervisada d'una base de dades textual amb tècniques bàsiques de topic modelling i anàlisi multivariant per dades textuals
Competències relacionades: CG4, CT3, CT4, CE01, CE09, CE20, -
Saber construir i validar el model adequat per una situació real nova
Competències relacionades: CG2, CG4, CT3, CT4, CE01, CE09, CE20, -
Saber integrar els continguts dels diferents temes d'aquest curs i els previs en una solució global per un problema complex
Competències relacionades: CG2, CE01, CE09, CE20, -
Saber planificar a llarg termini la modelització d'un problema real complex i resoldre'l al llarg del curs en equip
Competències relacionades: CT3, CT4, CB4,
Continguts
-
Models lineals generalitzats
Introducció als conceptes de models lineals generalitzats. Models logístics -
Sèries temporals
Introducció als processos estocàstics. Sèrie cronològica vs Sèrie temporal
Metodologia Box-Jenkins
Principals models de sèries temporals: MA, AR , ARIMA, SARIMA (concepte i estudi de casos) -
Anàlisis factorial
Métodes de reducció de dimensionalitat -
Clustering
Introducció. Principal models de classificació. Distàncies. -
Profiling
Descripció de les classificacions a partir de l'estudi de significativitat de variables -
Disseny d'experiments
Dissenys 2k complets i fraccionals. Anàlisis de sensibilitat i explicabilitat dels models. Identificació d'efectes principals i interaccions. Disseny de conjunts de dades d'entrenament per aprenentatge automàtic. Disseny de jocs de test per validació de models de dades
Activitats
Activitat Acte avaluatiu
Treball en equip
Els alumnes s'organitzen en grups i busquen unes dades reals que compleixen certs requisits marcats pel professor Les utilitzen per anar aplicant les tècniques i metodologies que es vegin al llarg del curs. Al final presenten un informe amb els resultats i fan una presentació oral amb els resultats més rellevants de l'estudiObjectius: 1 2 3 4 5 6 7 8 9
Continguts:
Teoria
0h
Problemes
0h
Laboratori
11h
Aprenentatge dirigit
0h
Aprenentatge autònom
27.5h
Aplicació pràctica temari assignatura
Execució de scripts pràctics a R sobre els conceptes vistos en teoria.
Teoria
0h
Problemes
0h
Laboratori
12.5h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Quiz 1
Durant el curs es realitzaran proves de resposta curta per fixar peces d'aprenentatge. Es farà al final de certes classes de laboratoriObjectius: 2
Setmana: 4
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Quiz 4
Durant el curs es realitzaran proves de resposta curta per fixar peces d'aprenentatge. Es farà al final de certes classes de laboratoriObjectius: 4
Setmana: 11
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Quiz 5
Durant el curs es realitzaran proves de resposta curta per fixar peces d'aprenentatge. Es farà al final de certes classes de laboratoriObjectius: 1
Setmana: 13
Teoria
0h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
0h
Metodologia docent
L'assignatura consta de dues hores de teoria i dues de laboratori per setmanaAl web de l'assignatura hi haurà el calendari de l'assignatura i els materials per preparar cada classe. La classe de teoria es dedicarà fonamentalment a explicar conceptes i a la presentació de casos i al desenvolupament d'activitats interactives amb els estudiants com la discussió dels casos, el desenvolupament de problemes.
Els estudiants realitzaran per grups de 4 persones un treball pràctic amb dades que buscaran ells mateixos i que compliran certes característiques fixades pel professorat. Amb aquestes dades cada equip realitzarà les sessions de pràctiques, cada setmana aplicant les tècniques del tema treballat a la sessió de teoria. El professor farà seguiment setmanal de tots els equips de treball en les sessions de laboratori.
A mitjans i a final de curs els equips presentaran els seus resultats en una sessió de posada en comú on es debatrà conjuntament sobre tots els projectes.
Mètode d'avaluació
Avaluació Ordinària:---------------------------
(Q) Qüestionaris. 20%
(P) Projecte. 30%
(EF) Examen Final. 50%
Nota Final Ordinària = 0,2 * Q + 0,3 * P + 0,5 * EF
Q. Consta de 5 qüestionaris individuals i presencials amb el mateix pes sobre la nota final. Aquests qüestionaris es realitzaran presencialment i no es podran recuperar en un altre dia diferent de la data programada ni per causa justificada.
Q = (Q1 + Q2 + Q3 + Q4 + Q5) / 5
P. Projecte en grup on es valoraran les següents competències: (P1) Recol·lecció de dades, anàlisi i interpretació de resultats i Transmissió de resultats (80%); (P2) Comunicació oral i escrita (20%);
P = 0,8 * P1 + 0,2 * P2
S'haurà d'obtenir una nota mínima d'un 3,5 en les proves individuals i presencials, és a dir,
2/7 * Q + 5/7 * EF > 3,5 per aprovar l'assignatura. Per altra banda, la realització del projecte també serà obligatòria per poder aprovar durant l'avaluació ordinària.
Avaluació Extraordinària:
---------------------------------
Només es poden presentar a la reavaluació aquelles persones que, havent-se presentat a l'examen final l'hagin suspès.
(EF) Examen Final Extraordinari
Nota Extraordinària = Mínim{7, Màxim{EE, 0,2 * Q + 0,3 * P + 0,5 * EE}}
En aquesta convocatòria no hi haurà nota mínima per aprovar. La màxima nota en aquesta convocatòria és un 7.
Bibliografia
Bàsic
-
Practical statistics for data scientists: 50+ essential concepts using R and Python
- Bruce, Peter; Bruce, Andrew; Gedeck, Peter,
O'Reilly,
[2020].
ISBN: 9781492072942
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004946307706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Data analysis and graphics using R : an example-based approach
- Maindonald, J. H; Braun, John,
Cambridge University,
2010.
ISBN: 9780521762939
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003210549706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Forecasting: principles and practice
- Hyndman, R.J.; Athanasopoulos, G,
O Texts,
2021.
ISBN: 9780987507136
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991005164678006711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Practical time series analysis: prediction with statistics and machine learning
- Nielsen, Aileen,
O'Reilly Media, Inc,
2019.
ISBN: 9781492041658
Capacitats prèvies
Introducció a l'EstadísticaConeixements de teoria de la probabilitat
Coneixements d'inferència estadística
Coneixements de models estadístics simples
Coneixements de visualització de dades
Coneixements bàsics de programació
Coneixements bàsics d'R
Àlgebra