Vés al contingut

Visió per Ordinador

Crèdits
6
Tipus
Obligatòria
Requisits
Aquesta assignatura no té requisits , però té capacitats prèvies
Departament
ESAII
Aquesta assignatura és curs bàsic de visió per ordinador, que inclou els principis del processament d'imatges, el reconeixement d'escenes i la classificació d'objectes

Professorat

Responsable

  • Isiah Zaplana Agut (isiah.zaplana@upc.edu)

Hores setmanals

Teoria
2
Problemes
0
Laboratori
2
Aprenentatge dirigit
0
Aprenentatge autònom
6

Competències

Transversals

  • CT6 [Avaluable] - Aprenentatge autònom. Detectar deficiències en el propi coneixement i superar-les mitjançant la reflexió crítica i l'elecció de la millor actuació per ampliar aquest coneixement.
  • Bàsiques

  • CB1 - Que els estudiants hagin demostrat posseir i comprendre coneixements en una àrea d'estudi que parteix de la base de l'educació secundària general, i se sol trobar a un nivell que, si bé es recolza en llibres de text avançats, inclou també alguns aspectes que impliquen coneixements procedents de l'avantguarda del seu camp d'estudi.
  • CB2 - Que els estudiants sàpiguen aplicar els seus coneixements al seu treball o vocació d'una manera professional i posseeixin les competències que solen demostrar-se mitjançant l'elaboració i defensa d'arguments i la resolució de problemes dins la seva àrea d'estudi.
  • CB5 - Que els estudiants hagin desenvolupat aquelles habilitats d'aprenentatge necessàries per emprendre estudis posteriors amb un alt grau d'autonomia
  • Específiques

  • CE01 - Resoldre els problemes matemàtics que puguin plantejar-se en l'àmbit de la intel·ligència artificial. Aplicar els coneixements sobre: àlgebra, càlcul diferencial i integral i mètodes numèrics; estadística i optimització.
  • CE02 - Dominar els conceptes bàsics de matemàtica discreta, lògica, algorísmica i complexitat computacional i la seva aplicació per al tractament automàtic de la informació per mitjà de sistemes computacionals i la seva aplicació per a la resolució de problemes.
  • CE03 - Identificar i aplicar els procediments algorítmics bàsics de les tecnologies informàtiques per dissenyar solucions a problemes, analitzant la idoneïtat i complexitat dels algoritmes proposats.
  • CE04 - Dissenyar i utilitzar de forma eficient els tipus i estructures de dades més adequats a la resolució d'un problema.
  • CE13 - Avaluar la complexitat computacional d'un problema, identificar estratègies algorítmiques que puguin conduir a la seva resolució i recomanar, desenvolupar i implementar aquella que garanteixi el millor rendiment d'acord amb els requisits establerts.
  • CE14 - Dominar els fonaments, paradigmes i tècniques pròpies dels sistemes intel·ligents i analitzar, dissenyar i construir sistemes, serveis i aplicacions informàtiques que utilitzin aquestes tècniques en qualsevol àmbit d'aplicació, inclòs la robòtica.
  • CE15 - Adquirir, formalitzar i representar el coneixement humà en una forma computable per a la resolució de problemes mitjançant un sistema informàtic en qualsevol àmbit d'aplicació, particularment els relacionats amb aspectes de computació, percepció i actuació en ambients o entorns intel·ligents.
  • CE18 - Adquirir i desenvolupar tècniques d'aprenentatge computacional i dissenyar i implementar aplicacions i sistemes que les utilitzin, incloent les dedicades a extracció automàtica d'informació i coneixement a partir de grans volums de dades.
  • CE19 - Utilitzar els sistemes de computació actuals, inclosos sistemes d'alt rendiment, per al procés de grans volums de dades des del coneixement de la seva estructura, funcionament i particularitats.
  • CE26 - Dissenyar i aplicar tècniques de processat i anàlisi d'imatges i visió per computador en l'àmbit de la intel·ligència artificial i la robòtica
  • Genèriques

  • CG2 - Utilitzar els coneixements fonamentals i metodologies de treball sòlides adquirits durant els estudis per adaptar-se als nous escenaris tecnològics de el futur.
  • CG4 - Raonar, analitzant la realitat i dissenyant algoritmes i formulacions que la modelin. Identificar problemes i construir solucions algorísmiques o matemàtiques vàlides, eventualment noves, integrant el coneixement multidisciplinari necessari, valorant diferents alternatives amb esperit crític, justificant les decisions preses, interpretant i sintetitzant els resultats en el context de l'domini d'aplicació i establint generalitzacions metodològiques a partir de aplicacions concretes.
  • CG6 - Identificar oportunitats per a aplicacions innovadores de la intel·ligència artificial i la robòtica en entorns tecnològics en contínua evolució.
  • CG8 - Observar un exercici ètic de la professió en totes les seves facetes, aplicant criteris ètics en el disseny de sistemes, algoritmes, experiments, utilització de dades, d'acord amb els sistemes ètics recomanats pels organismes nacionals i internacionals, amb especial èmfasi en seguretat, robustesa , privacitat, transparència, traçabilitat, prevenció de biaixos (de raça, gènere, religió, territori, etc.) i respecte als drets humans.
  • CG9 - Afrontar nous reptes amb una visió àmplia de les possibilitats de la carrera professional en l'àmbit de la Intel·ligència Artificial. Desenvolupar l'activitat aplicant criteris de qualitat i millora contínua, i actuar amb rigor en el desenvolupament professional. Adaptar-se als canvis organitzatius o tecnològics. Treballar en situacions de carència d'informació i/o amb restriccions temporals i/o de recursos.
  • Objectius

    1. Definir i quantificar les característiques d'una imatge
      Competències relacionades: CB1, CE04,
    2. Comparar i seleccionar les eines més adients de processat d'imatges en funció del problema a resoldre.
      Competències relacionades: CB1, CE01, CE02, CE03, CE04, CE15, CE19, CE26,
    3. Segmentar i etiquetar les regions d'una imatge
      Competències relacionades: CB5, CE01, CE03, CE04, CE13, CE15, CE26, CG2, CG4,
    4. Trobar els descriptors més significatius per a caracteritzar regions o punts d'interés d'un objecte
      Competències relacionades: CB5, CT6, CE14, CE15, CE18, CE26, CG2, CG4, CG8, CG9,
    5. Detectar i reconèixer la presència de determinats ítems en una imatge (amb i sense deep learning)
      Competències relacionades: CE14, CE15, CE18, CT6, CE19, CG4, CE26, CG2, CG6, CG8, CG9,
    6. Realitzar correctament experiments per avaluar els mètodes proposats, les seves limitacions i punts febles, en base a resultats objectivables.
      Competències relacionades: CB2, CE01, CE02, CE03, CE14, CG2, CG4, CG8,

    Continguts

    1. Fonaments de la imatge digital
      La imatge digital, propietats i característiques. Discretització i quantificació. Espais de color. Distàncies.
    2. Processament lineal, no-lineal i morfològic d'imatges
      Processament lineal. Operacions amb la intensitat. Transformacions geomètriques. Filtratge d'imatges. Derivades digitals. Processament morfològic.
    3. Segmentació d'imatges
      Binarització. Extracció de contorns. Clustering per color. Segmentació morfològica.
    4. Descriptors i característiques
      Descriptors topològics, geomètrics i estadístics. L'espai de característiques. Característiques basades en histogrames, transformada de Hough i Harris. Punts d'interès SIFT, ORB, i Haar.
    5. Reconeixement d'objectes
      Reconeixement mediant l'ús de plantilles. Reconeixement amb l'ús de classificadors. Aparellament local. Aparellament global.
    6. Visió amb aprenentatge profund
      Reconeixement, detecció i identificació d'objectes. Arquitectures: YOLO, Fast/Faster R-CNN, Mask R-CNN. Visual transformers.

    Activitats

    Activitat Acte avaluatiu


    Fonaments de la imatge digital

    La imatge digital, propietats i característiques. Discretització i quantificació. Espais de color. Distàncies.
    Objectius: 1
    Continguts:
    Teoria
    2h
    Problemes
    0h
    Laboratori
    2h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    4h

    Processament lineal, no-lineal i morfològic d'imatges (I)

    Processament lineal. Operacions amb la intensitat. Transformacions geomètriques. Filtratge d'imatges. Derivades digitals. Processament morfològic.
    Objectius: 2
    Continguts:
    Teoria
    4h
    Problemes
    0h
    Laboratori
    4h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    10h

    Processament lineal, no-lineal i morfològic d'imatges (II)

    Processament lineal. Operacions amb la intensitat. Transformacions geomètriques. Filtratge d'imatges. Derivades digitals. Processament morfològic.
    Objectius: 2
    Continguts:
    Teoria
    4h
    Problemes
    0h
    Laboratori
    4h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    8h

    Segmentació d'imatges

    Binarització. Extracció de contorns. Clustering per color. Segmentació morfològica.
    Objectius: 3
    Continguts:
    Teoria
    2h
    Problemes
    0h
    Laboratori
    4h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    4h

    Primer parcial


    Objectius: 1 2 3
    Setmana: 7 (Fora d'horari lectiu)
    Teoria
    0h
    Problemes
    0h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    0h

    Segon parcial


    Objectius: 4 5 6
    Setmana: 15 (Fora d'horari lectiu)
    Teoria
    0h
    Problemes
    0h
    Laboratori
    0h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    0h

    Descriptors i característiques

    Descriptors topològics, geomètrics i estadístics. L'espai de característiques. Característiques basades en histogrames, transformada de Hough i Harris. Punts d'interès SIFT, ORB, i Haar.
    Objectius: 4
    Continguts:
    Teoria
    6h
    Problemes
    0h
    Laboratori
    6h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    10h

    Reconeixement d'objectes

    Reconeixement mediant l'ús de plantilles. Reconeixement amb l'ús de classificadors. Aparellament local. Aparellament global.
    Objectius: 5 6
    Continguts:
    Teoria
    2h
    Problemes
    0h
    Laboratori
    4h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    10h

    Visió amb aprenentatge profund

    Reconeixement, detecció i identificació d'objectes. Arquitectures: YOLO, Fast/Faster R-CNN, Mask R-CNN. Visual transformers.
    Objectius: 5 6
    Continguts:
    Teoria
    6h
    Problemes
    0h
    Laboratori
    6h
    Aprenentatge dirigit
    0h
    Aprenentatge autònom
    20h

    Metodologia docent

    Les classes teòriques es complementaran amb la posada en pràctica sobre PC de les tècniques exposades.
    En les classes de laboratori es resoldran problemes reals de visió per computador.
    Es plantejaran problemes de complexitat superior que l'alumne haurà de resoldre a casa.

    Mètode d'avaluació

    - Hi haurà dues proves parcials P1 i P2 amb notes NP1 i NP2. No hi ha examen final.

    - Hi haurà un mínim d'un exercici plantejat a classe (teòric) i un plantejat als laboratoris informàtics (pràctic) amb notes ET i EP.

    - Hi haurà un projecte final amb nota NPF.

    La nota final s'obtindrà de la forma NF = 0'3*NP1+0,3*NP2 + 0,05*ET + 0,05*EP + 0,3*NPF.

    Bibliografia

    Bàsic

    Capacitats prèvies

    Àlgebra lineal, càlcul vectorial i probabilitat.
    Estructures de dades i programació