Test de control: Procesamiento de Información Visual (Examen D)
|
|
Título del Test:
![]() Test de control: Procesamiento de Información Visual (Examen D) Descripción: Examen D - Temas 1-4. Fundamentos Características Segmentación Movimiento |



| Comentarios |
|---|
NO HAY REGISTROS |
|
1. ¿Qué diferencia a una ilusión visual de una inconsistencia visual?. Las ilusiones solo afectan a niños; las inconsistencias afectan a adultos. La ilusión es una percepción errónea de un estímulo real; la inconsistencia es una figura físicamente imposible en 3D. Las inconsistencias son un tipo de ilusión óptica causada por el color. No existe diferencia; son términos sinónimos. 2. ¿Qué diferencia fundamental existe entre la visión fotópica y la escotópica?. La fotópica usa los bastones y la escotópica usa los conos. La fotópica (conos, buena iluminación, color) y la escotópica (bastones, baja iluminación, sin color). Ambas utilizan exclusivamente los conos pero con distinta sensibilidad. La escotópica solo se activa en total oscuridad. 3. La percepción estereoscópica de profundidad en el ser humano se basa en: La diferencia de enfoque del cristalino entre objetos cercanos y lejanos. La disparidad entre las dos imágenes retinianas (una por cada ojo). El movimiento de los músculos del iris al cambiar de objeto. La variación de color entre el centro y la periferia de la retina. 4. ¿Qué es una Matriz de Filtros de Color (CFA) y por qué es necesaria?. Un filtro paso bajo que elimina el ruido del sensor antes de la digitalización. Un patrón de filtros (típicamente Bayer con R, G, B) superpuesto al sensor porque los fotodiodos son ciegos al color. Una tabla de calibración que corrige la distorsión óptica de la lente. Un algoritmo de compresión que reduce el tamaño de las imágenes RAW. 5. ¿Qué significa que un núcleo de transformación sea separable?. Que solo puede aplicarse a imágenes en escala de grises. Que r(x,y,u,v)=r_1(x,u)·r_2(y,v) permitiendo calcular la transformada 2D como sucesión de transformadas 1D. Que el núcleo produce siempre valores reales positivos. Que la transformada inversa no existe para ese núcleo. 6. ¿Qué es un histograma de imagen y qué información proporciona?. Un gráfico del brillo medio por columna de la imagen. Una función discreta que estima la probabilidad de cada nivel de gris; describe el contraste global sin componente espacial. Una representación del contenido frecuencial de la imagen. Un mapa de bordes detectados en la imagen. 7. La transformación lineal por tramos (piecewise linear) permite: Aplicar un único factor de escala a toda la imagen. Controlar de forma precisa el contraste en rangos específicos de niveles de gris. Convertir la imagen directamente al dominio frecuencial. Eliminar el ruido de sal y pimienta. 8. ¿Cuál es el efecto de aumentar el tamaño de la máscara en un filtro de media?. Se reduce el suavizado y se acentúan los bordes. Se aumenta el suavizado (más difuminado) y se pierden más detalles finos. La imagen se oscurece uniformemente. No tiene ningún efecto apreciable. 9. En el detector de Canny, la supresión no maximal tiene como objetivo: Eliminar el ruido de sal y pimienta antes de detectar bordes. Adelgazar los bordes a un ancho de 1 píxel comparando cada punto con sus vecinos en la dirección del gradiente. Calcular el histograma local para umbralización adaptativa. Conectar segmentos de borde que estén separados por más de 3 píxeles. 10. La transformación logarítmica (s=c·log(1+r)) es especialmente útil para: Oscurecer uniformemente toda la imagen. Expandir el rango dinámico de valores oscuros y comprimir los claros (ej. visualizar el espectro de Fourier). Detectar bordes verticales en la imagen. Convertir la imagen de color a escala de grises. 11. ¿Qué ventaja tiene aplicar un suavizado Gaussiano antes de umbralizar una imagen?. Reduce el número de niveles de gris a exactamente 2. Limpia el histograma (más suave), produciendo regiones más compactas y menos sensibles al ruido. Convierte la imagen a espacio de color HSI automáticamente. Elimina la necesidad de elegir un umbral. 12. La aproximación poligonal de Douglas-Peucker simplifica un contorno mediante: Un filtro de mediana aplicado a las coordenadas del contorno. Un proceso recursivo que conserva solo los puntos cuya distancia a la recta de aproximación supera un umbral. La Transformada de Fourier del contorno para eliminar armónicos altos. Un ajuste por mínimos cuadrados de una elipse al contorno. 13. En deep learning, la capa de Dropout se utiliza durante el entrenamiento para: Aumentar la velocidad de convergencia eliminando capas innecesarias. Apagar neuronas aleatoriamente, obligando a la red a aprender características redundantes y evitando el sobreajuste. Reducir la resolución de las imágenes de entrada. Normalizar los pesos de la red a valores entre 0 y 1. 14. Los Vision Transformers (ViT) procesan imágenes dividiéndolas en: Píxeles individuales procesados secuencialmente como en una RNN. Parches (patches) tratados como tokens, relacionados globalmente mediante mecanismo de atención. Canales de color independientes sin interacción entre ellos. Octavas de una pirámide Gaussiana. 15. ¿Cuál es la diferencia principal entre una GAN y un autoencoder para generación de imágenes?. Las GANs usan aprendizaje supervisado; los autoencoders usan aprendizaje no supervisado. La GAN entrena un generador contra un discriminador de forma adversaria; el autoencoder aprende a reconstruir la entrada mediante codificador-decodificador. Los autoencoders pueden generar imágenes nuevas pero las GANs no. Las GANs solo funcionan con imágenes en escala de grises. 16. El aliasing temporal en vídeo se produce cuando: La resolución espacial es demasiado alta para la memoria disponible. La tasa de cuadros por segundo es insuficiente para capturar el movimiento real de la escena. Se aplica un filtro paso bajo antes de la captura. La profundidad de color supera los 24 bits por píxel. 17. El método de Lucas-Kanade falla en zonas sin textura porque: No puede aplicarse a imágenes en color. La matriz del sistema de mínimos cuadrados se vuelve singular (los gradientes son nulos o muy similares). Requiere que la escena sea completamente estática. Solo funciona con desplazamientos mayores de 10 píxeles. 18. ¿Qué papel juega la Ganancia de Kalman (K) en el ciclo de corrección del filtro?. Determina el número de iteraciones necesarias para converger. Pondera cuánto confiar en la medida frente al modelo: K grande más confianza en la medida; K pequeña más confianza en la predicción. Controla la tasa de aprendizaje de la red neuronal asociada. Define el número de partículas del filtro de partículas equivalente. 19. La luz estructurada en visión estéreo se utiliza para: Aumentar la velocidad de captura de las cámaras. Proyectar un patrón conocido sobre la escena para crear textura artificial y facilitar la correspondencia en zonas sin textura. Reducir el consumo energético del sistema de cámaras. Calibrar los parámetros intrínsecos de la cámara. 20. El coeficiente de Bhattacharyya se utiliza en el seguimiento Mean Shift para: Calcular la velocidad del objeto entre cuadros consecutivos. Medir la similaridad entre el histograma de color del modelo y el de la región candidata. Determinar el número óptimo de partículas en el filtro. Estimar la profundidad del objeto mediante disparidad estéreo. |





