Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits
, però té capacitats prèvies
Departament
EIO
Aquesta assignatura senta bases metodològics d'àmplia utilitat en l'observació de la realitat i la presa de decisions informada i prepara també per abordar models més complexos que es presenten en assignatures posteriors.
Els mètodes estadístics juguen un paper nuclear en molts dels mètodes d'intel.ligència artificial o anàlisi intel.ligent de dades que es veuran en assignatures posteriors. Per aquest motiu aquesta assignatura sentarà bases formals per poder seguir adequadament assignatures posteriors, a més de capacitar per a la resolució de problemes reals abordables amb estadística bàsica. Així, s'introduiran els principis estadístics bàsics des de la perspectiva del suport que poden aportar a l'anàlisi de problemes on intervé la intel.ligència artificial.
Aquesta assignatura aporta eines bàsiques per al tractament de dades, criteris d'elecció de mostres o construcció d'experiments per a constatar hipòtesis concretes a través de les dades en aplicacions reals, tests i proves d'hipòtesis associades a inferència estadística sobre dades i necessàries en statistical learning entre d'altres, models estadístics bàsics que es completaran amb l'assignatura següent de modelització estadística i que seran utilitzats a anàlisi intel.ligent de dades i a aprenentatge automàtic entre d'altres assignatures de la carrera.
L'assignatura tindrà un caràcter eminenment aplicat i posarà el focus en la resolució de problemes reals de l'àmbit de la IA utilitzant mètodes estadístics bàsics.
Professorat
Responsable
- Klaus Gerhard Langohr (klaus.langohr@upc.edu)
Altres
- Albert Dorador Chalar (albert.dorador@upc.edu)
- Sergi Martínez Maldonado (sergi.martinez.maldonado@upc.edu)
Hores setmanals
Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6
Competències
Transversals
Específiques
Genèriques
Objectius
-
Familiaritzar-se amb les eines d'estadística bàsica per poder tractar dades de forma correcta i interioritzar la metodologia estadística com un esquema bàsic d'extracció d'informació rellevant sobre fenòmens complexos
Competències relacionades: CG4, CE01, CE02,
Subcompetences- Interioritzar la metodologia estadística
- Tractar dades correctament
- Aplicar la metodologia estadística per extreure coneixement de fenòmens complexos
-
Seleccionar les dades rellevants per donar suport a una pregunta específica
Competències relacionades: CG8, CT8, CE01, -
Dissenyar els criteris d'elegibilitat d'una mostra correctament per respondre a un problema real
Competències relacionades: CT8, CE02, -
Dissenyar experiments bàsics per estudiar problemes reals
Competències relacionades: CT8, CE01, -
Realitzar preprocessament bàsic de les dades
Competències relacionades: CG4, CE02, -
Seleccionar els mètodes de modelització estadística més adecuats al problema, a la vista de l'estructura de les dades disponibles, els objectius de l'estudi i els usos posteriors dels resultats del model
Competències relacionades: CG4, CE01, CE02, -
Construir els models estadístics correctament a partir de les dades, fent us del software necessari, el context del problema de referència i presentar-lo públicament
Competències relacionades: CG4, CE01, CE02, -
Aplicar de forma integrada els coneixements estadístics obtinguts a classe en l'anàlisi d'un joc de dades real (aprofitant les fonts d'open data) donant resposta a un problema de referència de qualsevol àmbit real rellevant per la intel.ligència artificial, com salut, medi ambient, sostenibilitat, indústria4.0
Competències relacionades: CG4, CE01, CE02,
Subcompetences- Aprofitar open data rellevants per un problema
- Analitzar jocs de dades reals (salut, mediambient, ...)
- Integrar de coneixements estadístics de diferents temes de l'assignatura per solucionar un problema complex
-
Desenvolupar treballs pràctics i projectes amb perspectiva de gènere
Competències relacionades: CT8, -
Integrar els mecanismes de treball en equip en la realització dels treballs pràctics
Competències relacionades: CT4, -
Manegar amb destresa les eines informàtiques necessàries per resoldre els problemes reals plantejats amb les tècniques d'estadística bàsica vistes durant el curs.
Competències relacionades: CE02, -
Interpretar i contextualitzar els models estadístics construïts a partir de dades
Competències relacionades: CG4, CT3, CT8, -
Incorporar les recomanacions ètiques de la CE en matèria d'IA als treballs pràctics
Competències relacionades: CG8, -
Validar els models obtinguts i fer una interpretació crítica dels resultats des d'un punt de vista tècnic i contextualitzant els resultats en el marc del problema
Competències relacionades: CG4, CG8, CE02, -
Realitzar un informe automàtic amb la descriptiva d'una Base de dades, els models validats, i l'anàlisi integrada i crítica dels resultats en el context del problema de referència
Competències relacionades: CG4, CG8, CT3, CT4, CT8, -
Presentar públicament un informe estadístic que inclogui descriptiva, models i conclusions, comunicat adequadament a audiències tècniques i/o sense competències tècniques
Competències relacionades: CG8, CT3, CT4, CT8,
Continguts
-
Anàlisi descriptiva de les dades
Es treballarà com utilitzar eines estadístiques numèriques i gràfiques per descriure un conjunt de dades, així com les eines de reporting automàtic necessàries per realitzar informes automàtics amb aquesta descripció -
Introducció a la teoria de la probabilitat
S'aportaran les nocions bàsiques de probabilitat per a comprendre el concepte d'incertesa i els principals formalismes probabilístics per modelar-la, incloent conceptes de probabilitat condicionada i el teorema de Bayes, rellevant en assignatures posteriors -
Variables aleatòries
Definició de variable aleatòria discreta i contínua. Variables aleatòries conegudes: Bernoulli, Binomial, Poisson i Normal -
Inferència estadística
Proves d'hipòtesi, concepte de p-valor, intervals de confiança. Limitacions en aplicacions reals de la inferència clàssica. Inferència no paramètrica, test de permutacions de Fisher. Proves d'hipòtesi en statistical learning -
Regressió
Model bàsic (regressió lineal simple, mean least squares). Mesures de bondat de l'ajustament, validació. Regressió lineal múltple. Model lineal general (ANOVA, ANCOVA)
Activitats
Activitat Acte avaluatiu
Treball en equip
Els alumnes s'organitzen en grups i busquen unes dades reals que compleixen certs requisits marcats pel professor Les utilitzen per anar aplicant les tècniques i metodologies que es vegin al llarg del curs. Al final presenten un informe amb els resultats i fan una presentació oral amb els resultats més rellevants de l'estudiObjectius: 8 10
Continguts:
Teoria
0h
Problemes
0h
Laboratori
25h
Aprenentatge dirigit
0h
Aprenentatge autònom
50h
Teoria
30h
Problemes
0h
Laboratori
0h
Aprenentatge dirigit
0h
Aprenentatge autònom
30h
Metodologia docent
L'assignatura consta de dues hores de teoria i dues de laboratori per setmanaEn les classes de teoria es practicarà sempre que sigui possible l'esquema de classe invertida.
Al web de l'assignatura hi haurà el calendari de l'assignatura i els materials a portar preparats abans de cada classe. Es recorrerà a l'esquema de classe magistral puntualment quan el professor necessiti aclarir conceptes complexos que no han quedat clars amb els materials distribuïts prèviament a la classe. La classe de teoria es dedicarà fonamentalment a la presentació de casos i al desenvolupament d'activitats interactives amb els estudiants com la discussió dels casos, el desenvolupament de problemes o la realització de qüestionaris curts puntuals.
Els estudiants realitzaran per grups grans un treball pràctic amb dades que buscaran ells mateixos i que compliran certes característiques fixades pel professorat. Amb aquestes dades cada equip realitzarà les sessions de pràctiques, cada setmana aplicant les tècniques del tema treballat a la sessió de teoria. El professor farà seguiment setmanal de tots els equips de treball en les sessions de laboratori
Al final de curs els equips presentaran els seus resultats en una sessió de posta en comú on es debatrà conjuntament sobre tots els projectes
Mètode d'avaluació
Ítems que formen part de la nota:(T) Treball en equip fet al llarg del curs. 20%
(O) Prova oral de control de coneixements (discussió amb el professorat en la presentació oral dels treballs en equip). 10%
(CT4) Qualitat i rendiment de l'equip de treball. 5%
(CT3) Comunicació oral i escrita. 5%
(CT8) Perspectiva de gènere de l'equip i del treball. 5%
(E) Ètica de l'equip de treball i del treball pròpiament dit. 5%
(Q) Mitjana de dues proves individuals i presencials fetes al llarg del curs. 20%
(EF) Examen final presencial. 30%
Nota Projecte: P= 0.2*T+0.1*O + 0.05*CT4+ 0.05*CT3+ 0.05*CT8+ 0.05*E
Nota final= P+ 0.2*Q + 0.3*EF
Cal que 1/3*Q+2/3*EF sigui com a mínim 3.5.
_________________________________________________________________
(EE) Examen Final Extraordinari
Nota reavaluació = mín (7, màx(EE, P+ 0.2*Q + 0.3*EE)). La nota màxima de la reavaluació serà un 7.
Per l'examen final extraordinari no hi ha nota mínima. Només es poden presentar a la reavaluació aquelles persones que, havent-se presentat a l'examen final l'hagin suspès.
Bibliografia
Bàsic
-
Statistics: the art and science of learning from data
- Agresti, Alan; Franklin, Christine,
Pearson Education,
2017.
ISBN: 9781292164878
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004946307606711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Practical statistics for data scientists : 50+ essential concepts using R and Python
- Bruce, Peter; Bruce, Andrew; Gedeck, Peter,
O'Reilly Media, Inc,
2020.
ISBN: 9781492072942
-
A modern introduction to probability and statistics: understanding why and how
- Dekking, F.M; Kraaikamp, C.; Lopuhaä, H.P,
Springer,
2005.
ISBN: 9781846281686
-
Data analysis and graphics using R : an example-based approach
- Maindonald, John; Braun, John,
Cambridge University,
2010.
ISBN: 9780521762939
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991003210549706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Introduction to the practice of statistics
- Moore, D.S.; McCabe, G.P.; Craig, B.A,
WH Freeman,
2021.
ISBN: 9781319383664
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004946307806711&context=L&vid=34CSUC_UPC:VU1&lang=ca