Tema 8: Reconocimiento de Objetos 3D
![]() |
![]() |
![]() |
Título del Test:![]() Tema 8: Reconocimiento de Objetos 3D Descripción: Sistemas de percepcion |




Comentarios |
---|
NO HAY REGISTROS |
¿Cuál es el objetivo principal del reconocimiento de objetos 3D según el documento?. Crear modelos 3D de objetos. Medir la distancia entre objetos. Etiquetar objetos detectados por sensores. Analizar la textura de los objetos. ¿Qué técnica de aprendizaje profundo ha avanzado en la detección de objetos en cámaras 2D?. Visión por computador tradicional. Deep Learning. Procesamiento de imágenes clásico. Análisis de Fourier. ¿Cuál es el primer paso en el pipeline tradicional de reconocimiento 3D?. Cálculo de emparejamientos. Extracción de características (keypoints). Filtrado de emparejamientos erróneos. Cálculo de la transformación. ¿Qué son los keypoints?. Puntos aleatorios en la nube. Puntos de mayor densidad. Puntos 'interesantes' representativos de la nube. Puntos que forman parte de la superficie. ¿Qué hacen los descriptores en el pipeline tradicional?. Filtrar el ruido de la nube de puntos. Codifican patrones geométricos en la vecindad de cada keypoint. Determinar la posición de los keypoints. Crear una representación en 2D de la nube. ¿Qué tipo de descriptores consideran la vecindad cercana?. Descriptores locales. Descriptores globales. Ambos, descriptores locales y globales. Ninguno de los anteriores. ¿Qué se hace en el cálculo de emparejamientos?. Se calculan los keypoints. Se comparan descriptores para encontrar correspondencias. Se filtran los emparejamientos erróneos. Se calcula la transformación. ¿Qué estructura de datos se suele usar para acelerar la búsqueda de vecinos más cercanos?. Lista enlazada. Árbol binario. KD-Tree. Matriz. ¿Qué se intenta hacer en el filtrado de emparejamientos erróneos?. Encontrar correspondencias. Calcular la transformación. Eliminar falsos matches. Mejorar los matches buenos. ¿Qué método se utiliza para eliminar falsos matches?. ICP. SVD. RANSAC. K-means. ¿Qué devuelve RANSAC en el cálculo de la transformación?. Los descriptores. Los keypoints. Una transformación (rotación y traslación). Los emparejamientos. ¿Qué más permite conocer el cálculo de la transformación?. Su forma. Su color. Su pose en la escena. Su tamaño. ¿Qué hace ICP para mejorar la transformación?. Calcular los keypoints. Mejorar la transformación obtenida por RANSAC. Filtrar los emparejamientos. Encontrar nuevos matches. ¿Qué problema tiene el pipeline tradicional?. Es muy rápido. Es computacionalmente costoso. Tiene una alta capacidad de generalización. Es fácil de implementar. ¿Qué ventaja tienen los métodos basados en Deep Learning para el reconocimiento 2D?. Son más lentos. Mejoran eficiencia y precisión. Son más difíciles de implementar. No funcionan bien. ¿Qué tipo de red neuronal es ResNet?. Red neuronal recurrente. CNN profunda. Máquina de vectores de soporte. Árbol de decisión. ¿Qué problema evitan las conexiones residuales en ResNet?. El overfitting. El problema de 'vanishing gradients'. La lentitud en el entrenamiento. La falta de precisión. ¿Qué hace YOLO?. Clasificación de imágenes. Segmentación semántica. Detección rápida de objetos con bounding boxes. Generación de imágenes. ¿Qué tipo de segmentación realiza SEGNET?. Clasificación de imágenes. Segmentación semántica a nivel pixel. Detección de objetos con bounding boxes. Reconocimiento facial. ¿Por qué es más complejo el reconocimiento de objetos 3D con Deep Learning?. Por la falta de datos. Por la naturaleza desorganizada de los datos 3D. Porque las redes son muy lentas. Porque no hay suficientes algoritmos. ¿Qué representa POINTNET?. La nube 3D como una malla. La nube 3D voxelizada. La nube 3D como una colección de puntos. La nube 3D como un conjunto de planos. ¿Qué refleja cada voxel en POINTNET?. Color de los puntos. Posición de los puntos. Densidad de puntos. Textura de los puntos. ¿Cuál es un problema de POINTNET?. Es muy lento. Densidad no es fiable para distinguir formas. No usa CNNs. No puede clasificar objetos. ¿Qué hace LONCHANET?. Procesa la nube de puntos completa. Toma cortes del modelo 3D. Hace segmentación semántica. Detecta objetos con bounding boxes. ¿En qué es eficaz LONCHANET?. Objetos simples sin detalles. Objetos con texturas complejas. Objetos con estructuras internas visibles en los slices. Objetos en movimiento. ¿Qué usa ROTATIONNET?. Un solo render. Múltiples renders/imágenes desde diferentes vistas. La nube de puntos completa. Solo la textura del objeto. ¿Qué produce ROTATIONNET para cada vista?. Un descriptor. Una clasificación y evalúa su confiabilidad. Una transformación. Un emparejamiento. ¿Qué se combina para obtener una clasificación final robusta en ROTATIONNET?. Solo la vista más cercana. Resultados de todas las vistas. Solo los keypoints. Solo los descriptores. ¿Qué desventaja tiene Pipeline tradicional?. Alta precisión y velocidad. Maneja nubes de puntos directas. Costoso, poca generalización. Combina múltiples vistas. |