prg_test_piv

COMENTARIOS

ESTADÍSTICAS

RÉCORDS

REALIZAR TEST

Título del Test:

prg_test_piv

Descripción:
mimbre te quiero mucho

Autor:
nacho putita

OTROS TESTS DEL AUTOR

Fecha de Creación: 2026/05/27

Categoría: Otros

Número Preguntas: 100

Valoración:

(0)

COMPARTE EL TEST

Nuevo Comentario

Comentarios
NO HAY REGISTROS

Temario:

cual fue el impulso histórico decisivo para el procesamiento digital de imágenes en la decada de 1960. la invencion de la television a color. las primeras imágenes de la luna transmitidas por la sonda ranger 7. El desarrollo del formato JPEG. La aparición de las primeras cámaras réflex digitales.

El modelo heterárquico de un sistema PDI se caracteriza por: Un flujo de información estrictamente ascendente (de bajo a alto nivel). Un flujo bidireccional donde los niveles superiores retroalimentan a los inferiores. La ausencia de etapa de preprocesamiento. Procesar exclusivamente imágenes en color.

Las bandas de Mach son un fenómeno perceptivo en el que: El sistema visual reduce el contraste cerca de los bordes. El sistema visual exagera el contraste percibido cerca de los bordes entre zonas de distinta intensidad. Los colores complementarios se fusionan en un gris neutro. Las frecuencias altas se perciben como colores saturados.

cual es el demosaicing en el contexto de sensores de imagen. Un proceso de compresión con pérdida similar al JPEG. La reconstrucción de una imagen a color completa a partir de los datos parciales de una Matriz de Filtros de Color (CFA/Bayer). Un filtro de suavizado para reducir el ruido del sensor. La calibración de los parámetros intrínsecos de la cámara.

El espacio de color HSI separa la información cromática de la de luminancia. La componente I (Intensidad) se calcula como: I = max(R, G, B). I = (R + G + B) / 3. I = 0.299R + 0.587G + 0.114B. I = min(R, G, B).

¿Qué efecto tiene la transformación de negativo (s = L − 1 − r) sobre una imagen en escala de grises?. Aumenta el contraste en las zonas oscuras únicamente. Invierte la escala de grises: lo claro se vuelve oscuro y viceversa. Elimina el ruido de alta frecuencia. Convierte la imagen a binaria (blanco y negro puro).

La especificación del histograma permite: Ajustar el histograma de la imagen a una forma arbitraria definida por el usuario. Únicamente igualar el histograma a forma uniforme. Calcular la varianza de la imagen. Detectar bordes mediante el análisis de niveles de gris.

¿Cuál es la principal diferencia entre los operadores de Roberts y de Sobel para el cálculo del gradiente?. Roberts usa máscaras 3×3 y Sobel usa máscaras 2×2. Roberts usa diferencias cruzadas en máscaras 2×2 (sensible al ruido); Sobel usa máscaras 3×3 con suavizado incorporado. Sobel solo detecta bordes horizontales; Roberts detecta en todas las direcciones. No existe diferencia significativa entre ambos operadores.

El detector de bordes de Marr-Hildreth (LoG) busca bordes como: Máximos en la respuesta del gradiente de primer orden. Cruces por cero en la respuesta de la Laplaciana de la Gaussiana (segunda derivada). Mínimos locales del histograma de la imagen. Picos en el espectro de Fourier de la imagen.

Si una máscara de filtrado espacial tiene todos los coeficientes positivos que suman 1, se trata de un filtro: Paso alto (realce de bordes). Paso bajo (suavizado / alisamiento). Paso banda (deja pasar un rango de frecuencias). Derivativo (detección de puntos aislados).

¿Cuál de las siguientes NO es una condición formal de una segmentación válida?. La unión de todas las regiones reconstruye la imagen completa. Las regiones pueden solaparse parcialmente si comparten el mismo predicado. Cada región es un conjunto conexo. Regiones adyacentes que cumplan el mismo predicado deben fusionarse.

La Transformada de Hough para deteccion de rectas usa la representación polar (ρ, θ) en lugar de (a, b) porque: La representación polar ocupa menos memoria. Las rectas verticales tienen pendiente infinita en coordenadas cartesianas, pero no en polares. La representación polar permite detectar círculos pero la cartesiana no. La representación cartesiana no es compatible con imágenes digitales.

¿Cuándo es recomendable usar umbralización adaptativa en lugar de un umbral global (Otsu)?. A) Cuando la imagen tiene un histograma perfectamente bimodal. B) Cuando la iluminación no es uniforme o hay sombras variables en la imagen. C) Cuando la imagen es binaria (ya segmentada). D) Cuando la imagen contiene únicamente ruido gaussiano.

14. Las conexiones residuales (skip connections) de ResNet resuelven el problema de: A) El sobreajuste (overfitting) por exceso de datos de entrenamiento. B) El desvanecimiento del gradiente en redes muy profundas. C) La falta de invarianza a la rotación en las CNNs. D) La necesidad de preprocesar las imágenes a escala de grises.

15. En el detector de Viola-Jones, los clasificadores débiles se organizan en cascada para: A) Aumentar la resolución de la imagen de entrada. B) Descartar rápidamente ventanas que no contienen caras, reduciendo drásticamente el tiempo de cómputo. C) Entrenar la red con backpropagation en cada etapa. D) Convertir las características de Haar en descriptores SIFT.

16. La Restricción de Constancia de Brillo asume que: A) La intensidad de un píxel cambia linealmente con el tiempo. B) Un punto del objeto mantiene aproximadamente la misma intensidad entre cuadros consecutivos. C) Todos los objetos de la escena se mueven a la misma velocidad. D) La cámara permanece estática durante toda la secuencia.

17. ¿Por qué se necesita procesamiento jerárquico (pirámide Gaussiana) para calcular el flujo óptico?. A) Porque reduce el ruido de la imagen original. B) Porque la linealización de Taylor solo es válida para desplazamientos pequeños; la pirámide reduce los desplazamientos efectivos. C) Porque las pirámides permiten trabajar en el dominio frecuencial. D) Porque sin pirámide el flujo óptico solo detecta movimiento horizontal.

18. En visión estéreo, la disparidad entre dos imágenes es: A) La diferencia de enfoque entre las dos cámaras. B) El desplazamiento horizontal de un punto entre las dos vistas, inversamente proporcional a la profundidad. C) La diferencia de iluminación entre las dos imágenes. D) El ángulo de convergencia de los ejes ópticos de las cámaras.

19. Las tres fases del algoritmo CONDENSATION (Filtrado de Partículas) son: A) Detección, descripción y correspondencia. B) Selección (muestreo según pesos), predicción (modelo dinámico + ruido) y medida (actualización de pesos). C) Convolución, umbralización y segmentación. D) Predicción de Kalman, corrección de Kalman y suavizado.

20. El algoritmo Mean Shift para seguimiento visual caracteriza al objeto mediante: A) Un contorno activo (snake) que se deforma en cada cuadro. B) Un histograma de color que es robusto a rotaciones y deformaciones del objeto. C) Un descriptor SIFT recalculado en cada fotograma. D) La magnitud del gradiente en la región del objeto.

1. ¿Cuáles son los dos grandes objetivos del procesamiento de información visual?. A) Compresión de imágenes y transmisión de datos. B) Mejora de la información para interpretación humana y procesamiento para percepción autónoma artificial. C) Detección de bordes y segmentación de regiones. D) Almacenamiento eficiente y visualización en pantalla.

2. El fenómeno del contraste simultáneo demuestra que: A) Todos los seres humanos perciben exactamente los mismos colores. B) La iluminación percibida de un área depende de la intensidad de su entorno. C) Los sensores CCD son superiores a los CMOS en contraste. D) El espacio de color RGB es perceptualmente uniforme.

3. ¿Qué son las ambigüedades visuales?. A) Errores de hardware en el sensor de la cámara. B) Imágenes que admiten dos o más interpretaciones igualmente válidas (ej. cubo de Necker). C) Interferencias electromagnéticas en la señal de vídeo. D) Artefactos de compresión JPEG en zonas de alto contraste.

4. ¿Qué efecto tiene reducir la resolución de cuantización (menos bits por píxel) en una imagen?. A) Se reduce el tamaño espacial de la imagen (menos píxeles). B) Aparecen falsos contornos (efecto de bandeado) por la pérdida de niveles de gris. C) Se aumenta automáticamente el contraste. D) Se eliminan las altas frecuencias de la imagen.

5. En coordenadas homogéneas, un punto 2D (x, y) se representa como: A) El vector (x, y, 0). B) El vector (x, y, 1) y cualquier múltiplo escalar (kx, ky, k) con k≠0. C) El par (x/y, 1). D) La matriz 2×2 con x e y en la diagonal.

6. ¿Cuál es la ventaja del procesamiento local del histograma frente al global?. A) Es más rápido de calcular porque usa menos píxeles. B) Permite mejorar detalles en áreas pequeñas que el método global no puede resaltar. C) No necesita conocer el histograma de la imagen. D) Funciona exclusivamente con imágenes en color.

El Laplaciano (segunda derivada) se utiliza para realce de imagen sumándolo a la original. ¿Por qué la suma de los coeficientes de su máscara es cero?. A) Para que no modifique la media de la imagen (respuesta nula en zonas uniformes). B) Porque es un requisito de la Transformada de Fourier. C) Para que funcione solo con imágenes binarias. D) Porque los coeficientes negativos anulan el ruido automáticamente.

8. ¿Qué establece el Teorema de la Convolución?. A) Que toda imagen puede descomponerse en funciones seno y coseno. B) Que la convolución en el dominio espacial equivale a la multiplicación en el dominio frecuencial. C) Que la correlación y la convolución son siempre idénticas. D) Que un filtro paso bajo en frecuencia equivale a un filtro paso alto en el espacio.

9. ¿Qué pasos incluye el procedimiento estándar de filtrado en el dominio frecuencial?. A) Binarizar, aplicar Hough, detectar rectas. B) Padding con ceros, centrado, DFT, multiplicación por H(u,v), IDFT, recorte. C) Calcular histograma, igualar, umbralizar. D) Aplicar Sobel, suprimir no máximos, umbralizar por histéresis.

10. Un filtro paso alto enfatiza los bordes de la imagen. ¿Cuál es su relación con un filtro paso bajo?. A) No tienen ninguna relación matemática. B) El filtro paso alto es el complementario: H_HP(u,v) = 1 − H_LP(u,v). C) El filtro paso alto es el doble del filtro paso bajo. D) El filtro paso alto se obtiene rotando 90° el filtro paso bajo.

11. El algoritmo Split and Merge utiliza una estructura de datos tipo: A) Lista enlazada simple. B) Quadtree (árbol cuaternario). C) Tabla hash de frecuencias. D) Pila LIFO de píxeles.

12. ¿Qué problema resuelven los marcadores internos y externos en el algoritmo Watershed?. A) La falta de fronteras cerradas en la segmentación. B) La sobresegmentación causada por demasiados mínimos locales debidos al ruido. C) La necesidad de convertir la imagen a escala de grises. D) La imposibilidad de segmentar imágenes de más de 1 megapíxel.

13. En la clasificación Bayesiana, la hipótesis MAP (Maximum A Posteriori) selecciona: A) La clase con mayor probabilidad a priori P(h_i) independientemente de los datos. B) La clase que maximiza P(h_i | d), es decir, la más probable dados los datos observados. C) La clase cuya verosimilitud P(d | h_i) sea mínima. D) Siempre la clase con más muestras de entrenamiento.

14. ¿Cuál es la ventaja principal de una CNN frente a una red neuronal densa (fully connected) para imágenes?. A) Las CNNs no necesitan función de activación. B) Compartición de pesos (menos parámetros), explotación de localidad espacial e invarianza a traslación mediante pooling. C) Las redes densas no pueden procesar imágenes de más de 28×28 píxeles. D) Las CNNs no requieren datos de entrenamiento etiquetados.

15. Los modelos de difusión para generación de imágenes funcionan: A) Entrenando un generador contra un discriminador de forma adversaria (como las GANs). B) Aprendiendo a revertir un proceso de adición progresiva de ruido; en inferencia parten de ruido puro. C) Codificando la imagen en un vector latente y decodificándola directamente. D) Dividiendo la imagen en parches y aplicando atención (como los Vision Transformers).

16. ¿Cuál es la diferencia entre procesamiento de vídeo en línea (online) y fuera de línea (offline)?. A) Online significa con conexión a Internet; offline significa sin conexión. B) Online solo dispone de información pasada (causal); offline tiene acceso al vídeo completo y puede usar información futura. C) Online procesa en escala de grises; offline procesa en color. D) No existe diferencia significativa; son términos intercambiables.

17. El método de desentrelazado Weave funciona bien en escenas estáticas pero falla con movimiento porque: A) No tiene suficiente resolución temporal. B) Copia líneas del campo anterior, lo que produce efecto peine visible cuando hay desplazamiento entre campos. C) Aplica un filtro de mediana que elimina el detalle de movimiento. D) Solo funciona con resolución 4K o superior.

18. En el flujo óptico paramétrico, un modelo afín tiene 6 parámetros y permite representar: A) Únicamente traslación pura (desplazamiento constante). B) Traslación, rotación, escalado y cizallamiento. C) Únicamente rotación alrededor del centro de la imagen. D) Cualquier transformación proyectiva 3D arbitraria.

19. En la formulación Bayesiana del seguimiento visual, la asunción de Markov implica que: A) Todas las observaciones futuras son conocidas de antemano. B) El estado actual solo depende del estado inmediatamente anterior, no de todo el historial. C) El ruido de observación es siempre Gaussiano. D) El objeto seguido no puede cambiar de dirección.

20. Structure from Motion (SfM) permite reconstruir una escena 3D a partir de múltiples vistas. ¿Qué paso final optimiza conjuntamente las posiciones 3D y la trayectoria de la cámara?. A) Filtro de Kalman extendido. B) Bundle Adjustment (ajuste de haces). C) Transformada de Hough 3D. D) Detección de esquinas Harris.

1. ¿Qué diferencia a una ilusión visual de una inconsistencia visual?. A) Las ilusiones solo afectan a niños; las inconsistencias afectan a adultos. B) La ilusión es una percepción errónea de un estímulo real; la inconsistencia es una figura físicamente imposible en 3D. C) Las inconsistencias son un tipo de ilusión óptica causada por el color. D) No existe diferencia; son términos sinónimos.

2. ¿Qué diferencia fundamental existe entre la visión fotópica y la escotópica?. A) La fotópica usa los bastones y la escotópica usa los conos. B) La fotópica (conos, buena iluminación, color) y la escotópica (bastones, baja iluminación, sin color). C) Ambas utilizan exclusivamente los conos pero con distinta sensibilidad. D) La escotópica solo se activa en total oscuridad.

3. La percepción estereoscópica de profundidad en el ser humano se basa en: A) La diferencia de enfoque del cristalino entre objetos cercanos y lejanos. B) La disparidad entre las dos imágenes retinianas (una por cada ojo). C) El movimiento de los músculos del iris al cambiar de objeto. D) La variación de color entre el centro y la periferia de la retina.

4. ¿Qué es una Matriz de Filtros de Color (CFA) y por qué es necesaria?. A) Un filtro paso bajo que elimina el ruido del sensor antes de la digitalización. B) Un patrón de filtros (típicamente Bayer con R, G, B) superpuesto al sensor porque los fotodiodos son ciegos al color. C) Una tabla de calibración que corrige la distorsión óptica de la lente. D) Un algoritmo de compresión que reduce el tamaño de las imágenes RAW.

5. ¿Qué significa que un núcleo de transformación sea separable?. A) Que solo puede aplicarse a imágenes en escala de grises. B) Que r(x,y,u,v) = r₁(x,u) · r₂(y,v), permitiendo calcular la transformada 2D como sucesión de transformadas 1D. C) Que el núcleo produce siempre valores reales positivos. D) Que la transformada inversa no existe para ese núcleo.

6. ¿Qué es un histograma de imagen y qué información proporciona?. A) Un gráfico del brillo medio por columna de la imagen. B) Una función discreta que estima la probabilidad de cada nivel de gris; describe el contraste global sin componente espacial. C) Una representación del contenido frecuencial de la imagen. D) Un mapa de bordes detectados en la imagen.

7. La transformación lineal por tramos (piecewise linear) permite: A) Aplicar un único factor de escala a toda la imagen. B) Controlar de forma precisa el contraste en rangos específicos de niveles de gris. C) Convertir la imagen directamente al dominio frecuencial. D) Eliminar el ruido de sal y pimienta.

8. ¿Cuál es el efecto de aumentar el tamaño de la máscara en un filtro de media?. A) Se reduce el suavizado y se acentúan los bordes. B) Se aumenta el suavizado (más difuminado) y se pierden más detalles finos. C) La imagen se oscurece uniformemente. D) No tiene ningún efecto apreciable.

9. En el detector de Canny, la supresión no maximal tiene como objetivo: A) Eliminar el ruido de sal y pimienta antes de detectar bordes. B) Adelgazar los bordes a un ancho de 1 píxel comparando cada punto con sus vecinos en la dirección del gradiente. C) Calcular el histograma local para umbralización adaptativa. D) Conectar segmentos de borde que estén separados por más de 3 píxeles.

10. La transformación logarítmica (s = c · log(1 + r)) es especialmente útil para: A) Oscurecer uniformemente toda la imagen. B) Expandir el rango dinámico de valores oscuros y comprimir los claros (ej. visualizar el espectro de Fourier). C) Detectar bordes verticales en la imagen. D) Convertir la imagen de color a escala de grises.

11. ¿Qué ventaja tiene aplicar un suavizado Gaussiano antes de umbralizar una imagen?. A) Reduce el número de niveles de gris a exactamente 2. B) Limpia el histograma (más suave), produciendo regiones más compactas y menos sensibles al ruido. C) Convierte la imagen a espacio de color HSI automáticamente. D) Elimina la necesidad de elegir un umbral.

12. La aproximación poligonal de Douglas-Peucker simplifica un contorno mediante: A) Un filtro de mediana aplicado a las coordenadas del contorno. B) Un proceso recursivo que conserva solo los puntos cuya distancia a la recta de aproximación supera un umbral. C) La Transformada de Fourier del contorno para eliminar armónicos altos. D) Un ajuste por mínimos cuadrados de una elipse al contorno.

13. En deep learning, la capa de Dropout se utiliza durante el entrenamiento para: A) Aumentar la velocidad de convergencia eliminando capas innecesarias. B) Apagar neuronas aleatoriamente, obligando a la red a aprender características redundantes y evitando el sobreajuste. C) Reducir la resolución de las imágenes de entrada. D) Normalizar los pesos de la red a valores entre 0 y 1.

14. Los Vision Transformers (ViT) procesan imágenes dividiéndolas en: A) Píxeles individuales procesados secuencialmente como en una RNN. B) Parches (patches) tratados como tokens, relacionados globalmente mediante mecanismo de atención. C) Canales de color independientes sin interacción entre ellos. D) Octavas de una pirámide Gaussiana.

15. ¿Cuál es la diferencia principal entre una GAN y un autoencoder para generación de imágenes?. A) Las GANs usan aprendizaje supervisado; los autoencoders usan aprendizaje no supervisado. B) La GAN entrena un generador contra un discriminador de forma adversaria; el autoencoder aprende a reconstruir la entrada mediante codificador-decodificador. C) Los autoencoders pueden generar imágenes nuevas pero las GANs no. D) Las GANs solo funcionan con imágenes en escala de grises.

16. El aliasing temporal en vídeo se produce cuando: A) La resolución espacial es demasiado alta para la memoria disponible. B) La tasa de cuadros por segundo es insuficiente para capturar el movimiento real de la escena. C) Se aplica un filtro paso bajo antes de la captura. D) La profundidad de color supera los 24 bits por píxel.

17. El método de Lucas-Kanade falla en zonas sin textura porque: A) No puede aplicarse a imágenes en color. B) La matriz del sistema de mínimos cuadrados se vuelve singular (los gradientes son nulos o muy similares). C) Requiere que la escena sea completamente estática. D) Solo funciona con desplazamientos mayores de 10 píxeles.

18. ¿Qué papel juega la Ganancia de Kalman (K) en el ciclo de corrección del filtro?. A) Determina el número de iteraciones necesarias para converger. B) Pondera cuánto confiar en la medida frente al modelo: K grande → más confianza en la medida; K pequeña → más confianza en la predicción. C) Controla la tasa de aprendizaje de la red neuronal asociada. D) Define el número de partículas del filtro de partículas equivalente.

19. La luz estructurada en visión estéreo se utiliza para: A) Aumentar la velocidad de captura de las cámaras. B) Proyectar un patrón conocido sobre la escena para crear textura artificial y facilitar la correspondencia en zonas sin textura. C) Reducir el consumo energético del sistema de cámaras. D) Calibrar los parámetros intrínsecos de la cámara.

20. El coeficiente de Bhattacharyya se utiliza en el seguimiento Mean Shift para: A) Calcular la velocidad del objeto entre cuadros consecutivos. B) Medir la similaridad entre el histograma de color del modelo y el de la región candidata. C) Determinar el número óptimo de partículas en el filtro. D) Estimar la profundidad del objeto mediante disparidad estéreo.

1. ¿Qué función cumple el cristalino en el sistema visual humano?. A) Regular la cantidad de luz que entra en el ojo, como el diafragma de una cámara. B) Deformarse para enfocar la imagen sobre la retina, adaptando la distancia focal. C) Convertir la señal luminosa en impulsos eléctricos para el nervio óptico. D) Filtrar la radiación ultravioleta antes de que llegue a la córnea.

2. ¿Por qué se dice que la iluminación es a menudo más importante que el algoritmo en un sistema de visión artificial?. A) Porque una buena iluminación elimina la necesidad de cualquier procesamiento posterior. B) Porque una iluminación adecuada simplifica enormemente el problema, reduciendo sombras, reflejos y ambigüedades antes de procesar. C) Porque los algoritmos de visión artificial no funcionan sin luz infrarroja. D) Porque la iluminación determina la resolución espacial del sensor.

3. ¿Qué tipo de información se pierde irreversiblemente al proyectar una escena 3D sobre el plano 2D de la imagen?. A) La información de color de los objetos. B) La información de profundidad (distancia de cada punto a la cámara). C) La orientación horizontal de los objetos. D) El brillo relativo entre los objetos de la escena.

4. ¿Cuál es la diferencia entre la calibración por auto-calibración y la calibración fotogramétrica?. A) La auto-calibración usa un objeto 3D de referencia conocido; la fotogramétrica usa correspondencias entre imágenes. B) La auto-calibración usa correspondencias entre múltiples imágenes sin objeto conocido; la fotogramétrica usa un objeto 3D de geometría conocida y es más precisa. C) Ambas son idénticas pero con distinto nombre según el país de origen. D) La fotogramétrica solo funciona con cámaras analógicas.

5. El espacio de color CIE L*a*b* se considera perceptualmente uniforme. ¿Qué significa esto en la práctica?. A) Que todos los colores tienen la misma luminosidad. B) Que una misma distancia numérica entre dos colores en este espacio corresponde a una diferencia perceptiva similar para el ojo humano. C) Que solo contiene 256 colores uniformemente distribuidos. D) Que es idéntico al espacio RGB pero con nombres distintos para los ejes.

6. ¿Por qué el procesamiento global del histograma puede no mejorar detalles en áreas pequeñas de la imagen?. A) Porque el histograma global no existe para imágenes en color. B) Porque el histograma global refleja la distribución de toda la imagen y las regiones pequeñas apenas influyen en él, por lo que sus niveles de gris no se redistribuyen adecuadamente. C) Porque el histograma global solo funciona con imágenes binarias. D) Porque las áreas pequeñas no contienen píxeles válidos.

7. ¿Cuáles son los tres criterios de optimalidad en los que se basa el detector de bordes de Canny?. A) Velocidad de cómputo, compatibilidad con color y bajo consumo de memoria. B) Buena detección (minimizar falsos positivos/negativos), buena localización (mínima distancia al borde real) y respuesta única (un solo píxel por borde). C) Invarianza a rotación, invarianza a escala e invarianza a iluminación. D) Máxima resolución, mínimo ruido y máximo contraste.

8. ¿Qué diferencia conceptual hay entre un filtro lineal y un filtro no lineal en el dominio espacial?. A) Los filtros lineales solo funcionan con imágenes en escala de grises; los no lineales funcionan con imágenes en color. B) Un filtro lineal calcula una suma ponderada de los vecinos (ej. media, Sobel); un filtro no lineal aplica una operación no expresable como suma ponderada (ej. mediana, máximo). C) Los filtros no lineales siempre producen imágenes binarias. D) No existe diferencia real; todos los filtros espaciales son lineales.

9. ¿Qué relación existe entre las bajas frecuencias y las altas frecuencias en el espectro de Fourier de una imagen?. A) Las bajas frecuencias representan bordes y las altas frecuencias representan zonas uniformes. B) Las bajas frecuencias corresponden a variaciones suaves y gradientes amplios; las altas frecuencias corresponden a bordes, detalles finos y ruido. C) No hay relación; frecuencias bajas y altas son independientes. D) Las bajas frecuencias solo aparecen en imágenes en color y las altas en escala de grises.

10. ¿Por qué se recomienda aplicar un suavizado previo antes de calcular el gradiente para detección de bordes?. A) Porque el suavizado aumenta la resolución de la imagen. B) Porque el ruido genera falsas respuestas de gradiente; el suavizado reduce el ruido y hace la detección más robusta. C) Porque sin suavizado los bordes se detectan con demasiada precisión. D) Porque el gradiente solo funciona sobre imágenes borrosas.

11. ¿En qué se diferencia la segmentación basada en discontinuidad de la basada en similaridad?. A) La discontinuidad trabaja en el dominio frecuencial y la similaridad en el espacial. B) La discontinuidad busca cambios bruscos de intensidad (fronteras, bordes); la similaridad agrupa píxeles parecidos según un criterio (umbralización, regiones). C) La similaridad solo se aplica a imágenes binarias. D) No hay diferencia; son nombres alternativos para la misma técnica.

12. ¿Cuál es la ventaja principal de la estructura de cascada en el detector de Viola-Jones frente a usar un único clasificador complejo?. A) La cascada produce imágenes de mayor resolución. B) La cascada descarta rápidamente la gran mayoría de ventanas negativas en las primeras etapas (filtros simples), ahorrando tiempo al no evaluar clasificadores complejos en regiones sin interés. C) La cascada permite detectar la identidad de la persona además de la presencia del rostro. D) Un único clasificador complejo no puede entrenarse con el algoritmo AdaBoost.

13. ¿Qué diferencia hay entre el enfoque clásico de reconocimiento de patrones y el enfoque de Deep Learning?. A) El enfoque clásico usa redes neuronales y el Deep Learning usa árboles de decisión. B) En el clásico las características se diseñan manualmente y el clasificador se entrena por separado; en Deep Learning la red aprende automáticamente las características de forma end-to-end. C) El Deep Learning no necesita datos de entrenamiento. D) El enfoque clásico requiere siempre más datos que el Deep Learning.

14. ¿Para qué sirve la capa de Batch Normalization en una red neuronal convolucional?. A) Para reducir el tamaño espacial de los mapas de características. B) Para normalizar los datos internamente entre capas, estabilizando y acelerando el entrenamiento. C) Para apagar neuronas aleatoriamente y evitar el sobreajuste. D) Para aplicar la función de activación ReLU a cada neurona.

15. ¿Qué distingue a un modelo de difusión de una GAN para la generación de imágenes?. A) La GAN genera imágenes a partir de texto y el modelo de difusión a partir de otras imágenes. B) El modelo de difusión aprende a revertir un proceso progresivo de adición de ruido; la GAN entrena un generador contra un discriminador de forma adversaria. C) Las GANs producen imágenes en color y los modelos de difusión solo en escala de grises. D) No hay diferencia fundamental; ambos usan exactamente la misma arquitectura.

16. ¿Qué es el efecto peine (combing) en vídeo entrelazado y cuándo aparece?. A) Un artefacto de compresión MPEG que aparece en escenas oscuras. B) Un artefacto visual con líneas dentadas que aparece al mostrar campos entrelazados en pantallas progresivas cuando hay movimiento entre campos. C) Una distorsión del color causada por la saturación excesiva del sensor. D) Un efecto de desenfoque que aparece cuando la cámara está desenfocada.

17. ¿Cuáles son las tres principales aplicaciones del flujo óptico mencionadas en el temario?. A) Calibración de cámara, corrección de color y eliminación de ruido. B) Compresión de vídeo (vectores de movimiento), interpolación temporal (cámara lenta) y reconocimiento de acciones. C) Detección de bordes, segmentación y clasificación de texturas. D) Generación de imágenes, transferencia de estilo y superresolución.

18. ¿Por qué el Filtro de Kalman no es adecuado cuando hay múltiples hipótesis de localización del objeto (clutter)?. A) Porque el Filtro de Kalman no puede procesar imágenes en color. B) Porque mantiene una única distribución Gaussiana (unimodal) y no puede representar varias hipótesis simultáneas. C) Porque requiere que el objeto esté completamente estático. D) Porque solo funciona con secuencias de menos de 100 cuadros.

19. ¿Qué ventaja tiene representar un objeto mediante su histograma de color (como en Mean Shift) frente a un modelo de contorno rígido?. A) El histograma de color es siempre más rápido de calcular que cualquier descriptor de contorno. B) El histograma es robusto a rotaciones, deformaciones parciales y cambios de pose del objeto, ya que no depende de la disposición espacial de los píxeles. C) El histograma de color permite reconstruir la forma exacta del objeto en 3D. D) Los modelos de contorno rígido no pueden aplicarse a secuencias de vídeo.

20. Los estereogramas de punto aleatorio de Julesz y Marr demuestran que: A) La percepción de profundidad requiere siempre pistas monoculares como sombras y perspectiva. B) El cerebro humano es capaz de percibir profundidad basándose exclusivamente en la disparidad binocular, sin necesidad de pistas monoculares. C) La visión estéreo solo funciona con objetos de color uniforme. D) Los sensores CMOS son superiores a los CCD para captura estéreo.

1. ¿Cómo se define formalmente una imagen digital?. A) Una función continua f(x, y) donde x e y son coordenadas temporales. B) Una función bidimensional f(x, y) con coordenadas e intensidades finitas y discretas. C) Un conjunto de vectores de frecuencia en el dominio de Fourier. D) Una matriz de valores complejos obtenida tras la transformada wavelet.

2. Los conos y los bastones son los fotorreceptores de la retina. ¿Cuál de las siguientes afirmaciones es correcta?. A) Los bastones son responsables de la visión cromática y se concentran en la fóvea. B) Los conos perciben en condiciones de baja iluminación (visión escotópica). C) Los conos (6-7 millones) se localizan en la fóvea y son responsables de la visión cromática. D) Existen aproximadamente 6 millones de bastones y 150 millones de conos en cada ojo.

3. ¿Qué tipo de iluminación se utiliza para obtener la silueta binaria de un objeto?. A) Iluminación direccional. B) Iluminación difusa. C) Contraluz (iluminación posterior al objeto). D) Iluminación oblicua.

4. ¿Cuántas correspondencias de puntos se necesitan como mínimo para calcular una homografía (matriz H de 3×3)?. A) 2 correspondencias. B) 3 correspondencias. C) 4 correspondencias. D) 8 correspondencias.

5. ¿Cuál es la principal ventaja de los sensores CMOS frente a los CCD?. A) Mayor calidad de imagen en condiciones de poca luz. B) Lectura paralela (más rápida), menor consumo y menor coste. C) No necesitan una matriz de filtros de color (CFA). D) Son los únicos capaces de capturar imágenes en color.

6. La igualación del histograma transforma una imagen para que su histograma se aproxime a: A) Un histograma gaussiano centrado en el nivel medio. B) Un histograma uniforme, repartiendo píxeles por todo el rango dinámico. C) Un histograma con un único pico en el nivel de gris más frecuente. D) Un histograma idéntico al de otra imagen de referencia.

7. El operador de Sobel para detección de bordes se basa en: A) La segunda derivada (Laplaciano) de la imagen. B) Dos máscaras 3×3 que aproximan el gradiente en x e y, con peso 2 en la fila/columna central. C) Un filtro de mediana aplicado en dos direcciones ortogonales. D) La Transformada de Fourier local en ventanas de 3×3.

8. ¿Cuál de las siguientes afirmaciones sobre el detector de bordes de Canny es CORRECTA?. A) Utiliza un único umbral global para decidir si un píxel es borde. B) No requiere suavizado previo de la imagen. C) Aplica umbralización por histéresis con dos umbrales (alto y bajo) y análisis de conectividad. D) Es un operador de segunda derivada similar al Laplaciano.

9. En el filtrado frecuencial, ¿por qué el filtro Gaussiano de paso bajo es preferido frente al filtro Ideal?. A) Porque el filtro Gaussiano es más rápido de calcular. B) Porque el filtro Ideal produce artefactos de anillamiento (ringing) y el Gaussiano no. C) Porque el filtro Ideal solo funciona con imágenes en color. D) Porque el filtro Gaussiano no necesita la Transformada de Fourier.

10. ¿Por qué el filtro de mediana es más adecuado que el filtro de media para eliminar ruido de sal y pimienta?. A) Porque el filtro de mediana es más rápido de computar. B) Porque la mediana elimina valores extremos aislados sin difuminar los bordes de la imagen. C) Porque el filtro de media no puede aplicarse a imágenes en escala de grises. D) Porque la mediana realza los bordes además de eliminar el ruido.

11. El método de Otsu para umbralización automática se basa en: A) Calcular iterativamente la media de los dos grupos hasta convergencia. B) Maximizar la varianza inter-clase entre objeto y fondo. C) Minimizar la diferencia entre el histograma original y uno uniforme. D) Aplicar un filtro adaptativo local a cada píxel.

12. En el método de crecimiento de regiones (Region Growing), ¿cuál es el punto de partida del algoritmo?. A) Un conjunto de semillas conocidas que se expanden iterativamente según un predicado de similaridad. B) Una división inicial de la imagen en cuadrantes iguales (Quadtree). C) La detección previa de todos los bordes con Canny. D) Un histograma global que determina los umbrales de cada región.

13. En el detector de Viola-Jones, la imagen integral permite: A) Calcular la Transformada de Fourier en tiempo constante. B) Calcular la suma de píxeles de cualquier rectángulo en O(1). C) Detectar la identidad de una persona a partir de su rostro. D) Aplicar filtros Gaussianos sin convolución.

14. El descriptor SIFT es invariante a: A) Solo traslación y rotación. B) Traslación, escalado y rotación, y parcialmente a cambios de iluminación. C) Cualquier transformación proyectiva arbitraria. D) Solo cambios de iluminación.

15. En Transfer Learning con redes neuronales convolucionales (CNN), la estrategia habitual consiste en: A) Entrenar toda la red desde cero con los nuevos datos. B) Congelar las capas de extracción de características y reentrenar solo las capas finales de clasificación. C) Eliminar todas las capas convolucionales y añadir capas densas nuevas. D) Utilizar únicamente los datos de ImageNet sin ningún reentrenamiento.

16. La Ecuación Fundamental del Flujo Óptico presenta el llamado Problema de la Apertura porque: A) Solo es válida para imágenes en escala de grises. B) Es una única ecuación con dos incógnitas (u, v) por píxel, lo que impide una solución única. C) Requiere conocer la profundidad Z de cada punto de la escena. D) No puede aplicarse a secuencias de vídeo con movimiento.

17. ¿Cuál es la diferencia principal entre los métodos de Horn-Schunck y Lucas-Kanade para flujo óptico?. A) Horn-Schunck impone suavidad global del campo; Lucas-Kanade asume flujo constante en una ventana local. B) Lucas-Kanade genera flujo denso; Horn-Schunck solo calcula flujo en puntos de interés. C) Horn-Schunck es un método local; Lucas-Kanade es un método global. D) Ambos métodos son idénticos salvo en la función de coste.

18. El Filtro de Kalman es la solución óptima de seguimiento cuando: A) La distribución del estado es multimodal y no lineal. B) El sistema es lineal y el ruido es Gaussiano (distribución unimodal). C) Hay múltiples objetos similares en la escena (clutter). D) Se desconoce por completo el modelo dinámico del objeto.

19. En el desentrelazado adaptativo de vídeo, el parámetro γ (gamma) controla: A) La resolución espacial de cada campo. B) La mezcla entre interpolación espacial (Bob) y temporal (Weave) según la cantidad de movimiento detectado. C) El número de cuadros por segundo del vídeo resultante. D) La profundidad de color de cada píxel desentrelazado.

20. ¿Qué mejora aporta CamShift respecto al algoritmo Mean Shift estándar para seguimiento visual?. A) Utiliza un descriptor SIFT en lugar de histograma de color. B) Añade adaptación de escala de la ventana de seguimiento al tamaño aparente del objeto. C) Aplica un Filtro de Kalman para predecir la siguiente posición. D) Sustituye el histograma de color por un mapa de bordes Canny.

Denunciar Test