Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits
, però té capacitats prèvies
Departament
AC
Mail
josep.ll.berral@upc.edu, jordi.torres@upc.edu
Professorat
Responsable
- Josep Lluís Berral García (berral@ac.upc.edu)
Altres
- Jordi Torres Viñals (torres@ac.upc.edu)
Hores setmanals
Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6
Competències
Transversals
Bàsiques
Específiques
Genèriques
Objectius
-
Entendre l'ús de la computació d'altes prestacions i middlewares per a la intel·ligència artificial
Competències relacionades: CG1, CG9, CT3, CT6, CE19, -
Conèixer els components bàsics de hardware i middleware a plataformes d'altes prestacions
Competències relacionades: CG9, CT2, CE05, CE08, CE19, -
Aprendre l'ús d'acceleradors (e.g. GPUs) i eines per a la seva explotació
Competències relacionades: CG3, CT6, CE08, CE19, -
Aprendre conceptes de virtualització i ús de màquines virtuals
Competències relacionades: CG3, CT2, CB2, CE05, CE06, -
Familiaritzar-se amb les eines bàsiques per a l'explotació de sistemes distribuïts, amb models de programació orientats a la distribució
Competències relacionades: CG3, CT6, CE07, CE08, CE11, -
Conèixer els conceptes bàsics de sistemes distribuïts, interconnexió i comunicació entre sistemes.
Competències relacionades: CG3, CT3, CT6, CE07, CE11, -
Aprendre sobre sistemes de fitxers: usos bàsics dels sistemes de fitxers, sistemes en discos redundants, volums lògics i tolerància a fallades.
Competències relacionades: CG3, CT6, CB2, CE06, CE07, CE08, -
Descobrir els reptes de de la computació d'altes prestacions en intel·ligència artificial
Competències relacionades: CG1, CG9, CT2, CT3,
Continguts
-
Introducció als sistemes de Computació d'Altes Prestacions
Introducció als sistemes de computació de gran escala, especialitzats i al núvol. -
Acceleradors i dispositius d'altes prestacions
Incorporació d'acceleradors (e.g. GPUs) i eines per a la seva explotació. Operacions amb matrius accelerades mitjançant dispositius especialitzats. -
Middleware i plataformes d'altes prestacions per a la intel·ligència artificial
Components bàsics de hardware i middleware a plataformes d'altes prestacions. Ús d'eines de l'estat de l'art i la industria (e.g. TensorFlow, Pytorch, etc.) combinat amb dispositius especialitzats. -
Paral·lelisme aplicat a la intel·ligència artificial
Paral·lelisme en computació d'altes prestacions i la interacció amb els middlewares més estesos en aplicacions de la intel·ligència artificial, aprenentatge profund i transformers, i tècniques associades. -
Introducció a models distribuïts de programació per a Big Data
Introducció a models de programació Map-Reduce sobre sistemes de dades distribuïts i llenguatge Scala. -
Conceptes de virtualització i containerització
Introducció a l'ús de màquines virtuals i containerització, per a l'execució isolada i personalitzada d'entorns, així com migració de càrrega i gestió de recursos a sistemes compartits. -
Sistemes de fitxers locals i distribuïts, redundancia i disponibilitat
Usos bàsics de sistemes de fitxers, així com als sistemes d'emmagatzemament distribuït de dades, volums lògics, redundància, tolerància a fallades i alta disponibilitat. -
Computació a sistemes distribuïts
Conceptes bàsics de sistemes distribuïts (e.g. Hadoop i Spark), interconnexió i comunicacions, paradigmes de sistemes distribuïts i protocols, i tolerància a fallades. Eines bàsiques per a l'explotació de concurrència en sistemes distribuïts, i els seus models de programació orientats a la intel·ligència artidficial i el procés massiu de dades. -
Reptes de la computació d'altes prestacions per a la intel·ligència artificial
Reptes de present i futur de la computació d'altes prestacions aplicada a la intel·ligència artificial. Eines i entorns actuals a la industria, el núvol, l'acadèmia i la societat.
Activitats
Activitat Acte avaluatiu
Conceptes de virtualització i containerització
Introducció a l'ús de màquines virtuals i containerització, per a l'execució isolada i personalitzada d'entorns, així com migració de càrrega i gestió de recursos a sistemes compartits.Objectius: 4
Continguts:
Teoria
4h
Problemes
0h
Laboratori
4h
Aprenentatge dirigit
0h
Aprenentatge autònom
12h
Arquitectura de Serveis i Aplicacions
Introducció als models de Client-Servidor, sistemes de gestió d'execucions, i llançament d'aplicacions a sistemes clúster i Cloud.
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h
Supercomputació i Computació d'Altes Prestacions
Supercomputadors i Computació d'Altes Prestacions, eines i entorns. Familiarització amb les instal·lacions HPC, hand-on en ús de sistemes HPC i llenguatge C.Objectius: 2
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
9h
Acceleradors, supercomputadors i dispositius d'altes prestacions
Acceleradors i dispositius d'altes prestacions. GPUs i dispositius acceleradors. Multiplicació de matrius usant GPUs. Introducció a Python en un supercomputador.Objectius: 3
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
9h
Computació a sistemes distribuïts
Conceptes bàsics de sistemes distribuïts (e.g. Hadoop i Spark), interconnexió i comunicacions, paradigmes de sistemes distribuïts i protocols, i tolerància a fallades. Eines bàsiques per a l'explotació de concurrència en sistemes distribuïts, i els seus models de programació orientats a la intel·ligència artificial i el procés massiu de dades.Objectius: 6 5
Continguts:
Teoria
4h
Problemes
0h
Laboratori
4h
Aprenentatge dirigit
0h
Aprenentatge autònom
12h
Eines i entorns actuals a la industria, el núvol, l'acadèmia i la societat.
Eines i entorns actuals a la industria, el núvol, l'acadèmia i la societat.Objectius: 8
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h
Sistemes de fitxers locals i distribuïts, redundancia i disponibilitat
Usos bàsics de sistemes de fitxers, així com als sistemes d'emmagatzemament distribuït de dades, volums lògics, redundància, tolerància a fallades i alta disponibilitat.Objectius: 7
Continguts:
Teoria
2h
Problemes
0h
Laboratori
2h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h
Paral·lelisme aplicat a la intel·ligència artificial
Paral·lelisme aplicat a la intel·ligència artificial. Escalabilitat, tècniques avançades de deep learning, transformers i futur de Deep LearningObjectius: 2 1
Continguts:
Teoria
4h
Problemes
0h
Laboratori
4h
Aprenentatge dirigit
0h
Aprenentatge autònom
12h
Middleware i plataformes d'altes prestacions per a la intel·ligència artificial
Middleware i plataformes d'altes prestacions per a la intel·ligència artificial. TensorFlow/Pytorch, Deep Learning, LLMs i HPCObjectius: 1
Continguts:
Teoria
2h
Problemes
0h
Laboratori
4h
Aprenentatge dirigit
0h
Aprenentatge autònom
6h
Metodologia docent
El curs es basa en sessions de teoria i de laboratori presencials. Les sessions teòriques combinen classes magistrals i seminaris d'experts en l'àmbit, seguint el programa exposat en aquest pla d'estudis i basades en l'ús de material propi. Durant les sessions es promou el diàleg i la discussió per tal d'anticipar i consolidar els resultats d'aprenentatge de l'assignatura.Les sessions de laboratori tracten els aspectes relacionats amb les diferents tecnologies presentades, i segueixen els mateixos temes del plan d'estudis. Són sessions pràctiques en forma de Hands-On, utilitzant diferents recursos computacionals al Departament d'Arquitectura de Computadors i al Barcelona Supercomputing Center.
Mètode d'avaluació
L'avaluació es fonamentarà bàsicament en la realització de treballs de forma continua durant les diferents sessions del curs. L'assistència i la participació seran obligatòries, i per tant també s'avaluaran passant llista i requerint la participació a les sessions interactives. Finalment, hi haurà un treball de recerca al llarg de l'assignatura, que els estudiants hauran de presentar davant els seus companys.La distribució dels pesos de cada activitat és la corresponent:
- AS: assistència a classe, teoria i laboratoris (10%), que servirà per avaluar la competència transversal CT3.
- PR: participació a classe (15%)
- EX: exercicis de classe i laboratori (55%), com a mitja aritmètica dels diferents exercicis.
- RE: presentació de treball de recerca (20%), que servirà per avaluar les competències transversals CT2, CT3 i CT6.
La Nota Final (NF) de l'assignatura s'obté a partir de
NF = 0.10 x AS + 0.15 x PR + 0.55 x EX + 0.20 x RE
Re-avaluació:
a) Només es poden presentar a la reavaluació els qui han presentat a totes les activitats EX + RE, i tot i així han suspès NF. (Això és, s'exclou aquells qui voldrien anar a Reavaluació per pujar nota o són NP).
b) La nota màxima de Reavaluació serà un 7.
Bibliografia
Bàsic
-
First contact with Deep learning : practical introduction with Keras
- Torres, Jordi,
Kindle Direct Publishing,
[2018].
ISBN: 9781983211553
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004153269706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Dive into Deep Learning
- Zhang, Aston and Lipton, Zachary C. and Li, Mu and Smola, Alexander J.,
The authors,
2020.
-
High performance computing : modern systems and practices
- Sterling, Thomas; Anderson, Matthew; Brodowicz, Maciej,
Morgan Kaufmann,
[2018].
ISBN: 9780124201583
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004173809706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Spark: the definitive guide: big data processing made simple
- Chambers, B.; Zaharia, M,
O'Reilly,
2018.
ISBN: 9781491912300
-
Hadoop : the definitive guide
- White, Tom,
O'Reilly,
2015.
ISBN: 9781491901632
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991004054859706711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
La inteligencia artificial explicada a los humanos
- Torres Viñals, Jordi,
Plataforma Editorial,
2023.
ISBN: 9788419655561
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991005151879806711&context=L&vid=34CSUC_UPC:VU1&lang=ca -
Supercomputing for Artificial Intelligence: Foundations, Architectures and Scaling Deep Learning
- Torres Viñals, Jordi,
Watch This Space,
2025.
ISBN: 9798319328359
https://discovery.upc.edu/discovery/fulldisplay?docid=alma991005476510706711&context=L&vid=34CSUC_UPC:VU1&lang=ca
Complementari
-
BSC documentation about Marenostrum 5
- Barcelona Supercomputing Center,
Web links
- Documentation MareNostrum-V https://www.bsc.es/supportkc/docs/MareNostrum5/intro/