Deep Vision: R-CNN
![]() |
![]() |
![]() |
Título del Test:![]() Deep Vision: R-CNN Descripción: Test del temario de RNDL del máster en I.A. VIU 2023 |




Comentarios |
---|
NO HAY REGISTROS |
¿Qué es la detección de objetos en visión por computadora?. Medir la calidad de las imágenes. Crear imágenes con objetos sintéticos. Encontrar y delinear objetos en imágenes. Clasificar objetos en imágenes. ¿Cuál es el problema principal con la aproximación de ventana deslizante para la detección de objetos?. No es capaz de manejar imágenes a color. Genera muchas ventanas y requiere mucho tiempo de computación. Es difícil implementarla en modelos de aprendizaje profundo. No puede detectar objetos pequeños. ¿Qué hace la red convolucional regional basada en regiones (RCNN) para mejorar la aproximación de ventana deslizante?. Utiliza solo ventanas de tamaño fijo para la detección. Utiliza un algoritmo de búsqueda selectiva que propone solo un número limitado de regiones. Aplica una operación de pooling en la imagen para reducir su tamaño. Convierte la imagen completa en un vector y lo procesa en un modelo SVM. ¿Cómo maneja Fast RCNN la extracción de características de las regiones propuestas?. Utiliza un algoritmo de búsqueda selectiva más rápido para las regiones. Utiliza una red convolucional para procesar toda la imagen y crear un mapa de características. Utiliza un modelo SVM para extraer las características. Aplica el modelo CNN a cada región propuesta individualmente. ¿Cuál es el problema principal con el algoritmo de propuesta de región utilizado en Fast RCNN?. Es lento y puede producir propuestas de región inexactas. No puede manejar imágenes en escala de grises. No puede detectar objetos pequeños. Depende de modelos lineales para la clasificación. ¿Cómo aborda Faster RCNN el problema del algoritmo de propuesta de región?. Introduce una red de propuesta de región que puede aprender a generar mejores regiones. Utiliza un modelo de regresión lineal para mejorar las propuestas. Reduce la cantidad de regiones propuestas a través de un algoritmo de selección. Utiliza un algoritmo de búsqueda selectiva mejorado para generar propuestas de región. ¿Qué agrega Mask RCNN a la arquitectura de Faster RCNN?. Eliminación del algoritmo de búsqueda selectiva. Predicción de la clase del objeto en cada región propuesta. Predicción de máscaras para objetos en las regiones propuestas. Reducción de la cantidad de regiones propuestas. ¿Cómo se maneja la predicción de máscaras en Mask RCNN?. Las máscaras se generan utilizando un algoritmo de búsqueda selectiva modificado. Se utilizan técnicas de superresolución para generar máscaras de alta calidad. Se introduce una rama adicional en la arquitectura para predecir máscaras pixel a pixel. Las máscaras se generan directamente a partir de las coordenadas de las regiones propuestas. ¿Qué problema se aborda con la capa de alineación de regiones de interés en Mask RCNN?. Permite una clasificación más precisa de los objetos en las regiones propuestas. Permite una predicción de máscaras más precisa preservando la posición exacta de los píxeles. Acelera el proceso de entrenamiento de la red. Reduce la cantidad de regiones propuestas generadas por el modelo. ¿Cuál es la principal ventaja de la arquitectura You Only Look Once (YOLO) para la detección de objetos?. Depende de modelos complejos de aprendizaje profundo para la detección. Proporciona una precisión extremadamente alta en la detección de objetos pequeños. Realiza la detección de objetos en una sola pasada, lo que la hace más rápida. Utiliza algoritmos de búsqueda selectiva para mejorar la precisión. ¿Qué es la detección de objetos en visión por computadora?. Encontrar y delinear objetos en imágenes. Medir la calidad de las imágenes. Clasificar objetos en imágenes. Crear imágenes con objetos sintéticos. ¿Cuál es el problema principal con la aproximación de ventana deslizante para la detección de objetos?. No es capaz de manejar imágenes a color. Genera muchas ventanas y requiere mucho tiempo de computación. No puede detectar objetos pequeños. Es difícil implementarla en modelos de aprendizaje profundo. ¿Qué hace la red convolucional regional basada en regiones (RCNN) para mejorar la aproximación de ventana deslizante?. Aplica una operación de pooling en la imagen para reducir su tamaño. Utiliza solo ventanas de tamaño fijo para la detección. Convierte la imagen completa en un vector y lo procesa en un modelo SVM. Utiliza un algoritmo de búsqueda selectiva que propone solo un número limitado de regiones. ¿Cómo maneja Fast RCNN la extracción de características de las regiones propuestas?. Utiliza un algoritmo de búsqueda selectiva más rápido para las regiones. Aplica el modelo CNN a cada región propuesta individualmente. Utiliza una red convolucional para procesar toda la imagen y crear un mapa de características. Utiliza un modelo SVM para extraer las características. ¿Cuál es el problema principal con el algoritmo de propuesta de región utilizado en Fast RCNN?. No puede manejar imágenes en escala de grises. Depende de modelos lineales para la clasificación. No puede detectar objetos pequeños. Es lento y puede producir propuestas de región inexactas. ¿Cómo aborda Faster RCNN el problema del algoritmo de propuesta de región?. Reduce la cantidad de regiones propuestas a través de un algoritmo de selección. Utiliza un algoritmo de búsqueda selectiva mejorado para generar propuestas de región. Introduce una red de propuesta de región que puede aprender a generar mejores regiones. Utiliza un modelo de regresión lineal para mejorar las propuestas. ¿Qué agrega Mask RCNN a la arquitectura de Faster RCNN?. Predicción de máscaras para objetos en las regiones propuestas. Predicción de la clase del objeto en cada región propuesta. Reducción de la cantidad de regiones propuestas. Eliminación del algoritmo de búsqueda selectiva. ¿Cómo se maneja la predicción de máscaras en Mask RCNN?. Las máscaras se generan utilizando un algoritmo de búsqueda selectiva modificado. Se utilizan técnicas de superresolución para generar máscaras de alta calidad. Las máscaras se generan directamente a partir de las coordenadas de las regiones propuestas. Se introduce una rama adicional en la arquitectura para predecir máscaras pixel a pixel. ¿Qué problema se aborda con la capa de alineación de regiones de interés en Mask RCNN?. Permite una predicción de máscaras más precisa preservando la posición exacta de los píxeles. Permite una clasificación más precisa de los objetos en las regiones propuestas. Acelera el proceso de entrenamiento de la red. Reduce la cantidad de regiones propuestas generadas por el modelo. ¿Cuál es la principal ventaja de la arquitectura You Only Look Once (YOLO) para la detección de objetos?. Depende de modelos complejos de aprendizaje profundo para la detección. Utiliza algoritmos de búsqueda selectiva para mejorar la precisión. Proporciona una precisión extremadamente alta en la detección de objetos pequeños. Realiza la detección de objetos en una sola pasada, lo que la hace más rápida. ¿Qué es el enfoque "You Only Look Once" (YOLO) en el contexto de la detección de objetos?. Un enfoque que utiliza algoritmos de búsqueda selectiva para encontrar objetos. Un enfoque que realiza la detección de objetos en una sola pasada de la red neuronal. Un enfoque que divide la imagen en regiones y aplica CNN en cada región. Un enfoque que utiliza múltiples capas para detectar objetos en diferentes escalas. ¿Qué significa el término "non-maximum suppression" en la detección de objetos?. Es un método para reducir la velocidad de la detección de objetos. Es un método para mejorar la precisión de las detecciones. Es un método para aumentar la confianza de las detecciones de objetos. Es un método para eliminar las detecciones duplicadas y seleccionar la detección con la confianza más alta. ¿Cuál es el propósito del algoritmo de búsqueda selectiva (selective search) en Faster RCNN?. Clasificar objetos en una imagen. Generar propuestas de regiones que podrían contener objetos de interés. Dividir la imagen en regiones semánticas. Aplicar filtros de convolución para extraer características. ¿Qué es la precisión (precision) en el contexto de la evaluación de modelos de detección de objetos?. La proporción de verdaderos positivos entre todas las instancias positivas en los datos. La medida de cuántos objetos se han detectado correctamente en total. La proporción de todas las predicciones correctas entre todas las predicciones realizadas por el modelo. La proporción de detecciones positivas que son correctas entre todas las detecciones positivas. ¿Cuál es la tasa de falsos positivos (false positive rate) en la evaluación de modelos de detección de objetos?. La proporción de verdaderos negativos entre todas las instancias negativas en los datos. La proporción de detecciones incorrectas entre todas las detecciones realizadas por el modelo. La medida de cuántos objetos se han detectado incorrectamente en total. La proporción de falsos positivos entre todas las instancias negativas en los datos. ¿Cuál es el área bajo la curva de operación del receptor (AUC-ROC) en la evaluación de modelos de detección de objetos?. Una métrica que mide el tiempo de ejecución del modelo durante la detección. Una métrica que representa la capacidad del modelo para discriminar entre clases positivas y negativas. Una métrica que evalúa la calidad visual de las detecciones realizadas por el modelo. Una métrica que indica la precisión del modelo en la detección de objetos pequeños. ¿Qué es la función de pérdida (loss function) en el entrenamiento de modelos de detección de objetos?. Una función que evalúa la velocidad de detección del modelo. Una función que determina la confianza de las detecciones realizadas por el modelo. Una función que calcula la discrepancia entre las predicciones del modelo y las etiquetas reales, utilizada para optimizar el modelo durante el entrenamiento. Una función que representa la tasa de aciertos del modelo durante el entrenamiento. ¿Cuál es el propósito de la técnica de aumento de datos (data augmentation) en el entrenamiento de modelos de detección de objetos?. Eliminar el ruido en los datos de entrenamiento para obtener predicciones más precisas. Alinear los datos de entrenamiento con las predicciones del modelo. Reducir la cantidad de datos de entrenamiento para acelerar el proceso de entrenamiento. Aumentar la variabilidad en los datos de entrenamiento para mejorar la generalización del modelo. ¿Qué es la función de activación "softmax" en el contexto de la clasificación de objetos?. Una función que realiza la operación de reducción de dimensionalidad en los datos de entrada. Una función que aplica filtros de convolución en los datos de entrada. Una función que determina la confianza de las detecciones del modelo. Una función que convierte las puntuaciones brutas del modelo en probabilidades para cada clase. ¿Qué es la función de pérdida "iou loss" (intersection over union loss) en la detección de objetos?. Una función que evalúa la velocidad de ejecución del modelo durante la detección. Una función que calcula la discrepancia entre las máscaras de segmentación predichas y las máscaras reales de los objetos. Una función que mide la calidad de las detecciones basándose en el área de intersección sobre unión. Una función que determina la precisión de las detecciones en relación con las anotaciones reales. ¿Cuál es el propósito de la capa de "RoI Align" en la detección de objetos con máscaras?. Reducir el tamaño de las máscaras para un procesamiento más rápido. Eliminar el ruido en las máscaras para obtener resultados más limpios. Aplicar filtros de convolución a las máscaras. Preservar la precisión de la posición de los píxeles en las máscaras durante el proceso de alineación. ¿Qué es el método "non-maximum suppression" en el contexto de la detección de objetos con máscaras?. Es un método para eliminar las máscaras duplicadas y seleccionar la máscara con la confianza más alta. Es un método para reducir la velocidad de la detección de máscaras de objetos. Es un método para mejorar la precisión de las máscaras de objetos detectados. Es un método para aumentar la confianza de las máscaras de objetos detectados. ¿Qué es el concepto de "zero-shot learning" en el campo del aprendizaje automático?. Un enfoque que no requiere ningún dato de entrada para entrenar un modelo. Un enfoque que utiliza cero parámetros en el modelo de aprendizaje automático. Un enfoque que implica el aprendizaje a partir de cero en cada iteración. Un enfoque donde un modelo puede realizar tareas sin haber sido entrenado específicamente para esas tareas. ¿Cuál es el propósito de la técnica "transferencia de estilo" en el campo del procesamiento de imágenes?. Es una técnica que transfiere el contenido semántico de una imagen a otra imagen. Es una técnica que transforma imágenes en un estilo artístico específico. Es una técnica que aplica el estilo visual de una imagen a otra imagen. Es una técnica que combina múltiples estilos visuales en una sola imagen. |