2315040_MD_IA_CORP
|
|
Título del Test:
![]() 2315040_MD_IA_CORP Descripción: Test 2315040 |



| Comentarios |
|---|
NO HAY REGISTROS |
|
¿En qué fase de la minería de datos se evalúa el rendimiento del modelo?. Introducción de los datos. Creación y selección de características. Creación y entrenamiento de modelos. Implementación del modelo. ¿Cuál de las siguientes opciones se corresponde con un conjunto de datos no estructurados?. El contenido de una base de datos relacional. Un archivo csv. Los podcasts sobre historia subidos en Spotify. Una tabla con los datos de reserva de un restaurante. El departamento de marketing quiere agrupar a los clientes de la empresa según sus gustos para poder realizar campañas de publicidad dirigidas. Indica en qué tipo de tarea de minería de datos se enmarca el problema anterior: Clasificación. Regresión. Clustering. Análisis de correlación. Indica qué tipo de aprendizaje automático trabaja con datos no etiquetados: Aprendizaje supervisado. Aprendizaje no supervisado. Aprendizaje por refuerzo. Aprendizaje híbrido. Indica qué herramienta utilizada en minería de datos fue desarrollada por John Chambers en los años setenta dentro de la compañía Laboratorios Bell: KNIME. Python. R. BigML. Se quieren sustituir los valores perdidos de una variable por una medida de tendencia central. El histograma de dichas variables es el siguiente: ¿Cuál de las siguientes medidas de tendencia central es la más adecuada?. Media. Mediana. Moda. Varianza. Una entidad bancaria quiere detectar qué cantidad de transacciones mensuales se puede considerar como anómala. Se sabe que el primer cuartil es igual a 7 transacciones (Q1 = 7) y el tercer cuartil es igual a 23 transacciones (Q3 = 23). Para detectar los outliers se emplea el método de Tukey con k = 1,5. Indica qué número de transacciones se considera un outlier. Para ello, considera únicamente el extremo superior del intervalo. Más de 27 transacciones. Más de 47 transacciones. Más de 25 transacciones. Más de 34 transacciones. Indica con qué tipo de JOIN se mantienen todos los registros independientemente de que tengan correspondencia en la otra tabla: INNER JOIN. OUTER JOIN. LEFT JOIN. RIGHT JOIN. Dada la siguiente variable: X = [2; 0; 1; 3]. ¿Cuál de las siguientes opciones se corresponde con su normalización min-max?. [-1,8; 0,4; 0,1; -1,9]. [0; 3]. [0,67; 0; 0,33; 1]. [0,45; -1,34; -0,45; 1,34]. En un análisis de componentes principales, las componentes principales se corresponden con: Los autovalores de la matriz X. Los autovectores de la matriz X. Los autovalores de la matriz X^T X. Los autovectores de la matriz X^T X. Dado el problema Y = Xẞ + ε, la regresión lineal busca los coeficientes ẞ tal que: || Y – Xẞ || sea mínimo. ||Y – Xẞ|| sea máximo. ||X – Yẞ|| sea mínimo. ||X – Yẞ|| sea máximo. Una compañía de seguros utiliza una regresión logística múltiple para predecir la baja de sus clientes. De esta forma, pueden ofrecer ofertas personalizadas para evitar la marcha de algunos de ellos. Dicho modelo utiliza dos regresores: r1 que mide la antigüedad del cliente en días, y r2 que mide el precio de la mensualidad del cliente en euros. Tras ajustar el modelo, sus parámetros son: β0 = −3, β1 = −0,005 y β2 = 0,03. El modelo codifica con 0 la permanencia y con 1 la baja. ¿Se debe ofrecer una oferta personalizada a un cliente que lleva en la compañía 3 meses completos (90 días) y paga al mes 100 €?. Sí, porque p(r₁, r₂) < 0,5. Sí, porque p(r₁, r₂) > 0,5. No, porque p(r₁, r₂) < 0,5. No, porque p(r₁, r₂) > 0,5. En el contexto de la estadística bayesiana, indica cuál es la expresión de la verosimilitud: P(G = k | X = x). P(G = k). P(X = x | G = k). P(X = x). Indica cuál es la expresión de la función núcleo uniforme: a. b. c. d. Se dispone del siguiente árbol de decisión que permite clasificar 4 tipos de flores: setosa, versicolor, virgínica y lirio. Dada una nueva flor cuyos datos son [petal_width = 0.5, petal_lenght = 2], indica a qué categoría asigna el modelo. Setosa. Versicolor. Virgínica. Lirio. En un problema de clasificación de más de dos clases, ¿qué función de activación se debería elegir para la última capa de una red neuronal?. Tangente hiperbólica. Sigmoide. ReLU. Softmax. Dada la función de pérdida C(x,y) = x².y² y un learning rate α = 0,1, calcula el resultado de realizar dos pasos del descenso del gradiente si se parte del punto [X₀, y₀] = [1; 1]: C(x₂, y₂) = 0,41. C(x₂, y₂) = 0,32. C(x₂, y₂) = 0,27. C(x₂, y₂) = 0,24. Indica a qué función de pérdida le corresponde la siguiente expresión: Error cuadrático medio. Error absoluto medio. Entropía cruzada media. Tasa de error. Al implementar un algoritmo genético te das cuenta de que converge demasiado rápido a un óptimo local y, por lo tanto, las soluciones a las que llega no son suficientemente buenas. ¿Qué deberías hacer para solucionarlo?. Disminuir el tamaño de la población. Elegir la selección por torneo como mecanismo de selección. Elegir la selección por truncamiento como mecanismo de selección. Generar individuos similares en la población inicial. Calcula la distancia de Chebyshev de los siguientes dos puntos: P = (2; 5; 1), Q = (6; 1; 7). 8,25. 14. 6. 4. Indica qué opción se ajusta a la siguiente imagen: Regresión con sesgo alto. Clasificación con sesgo alto. Regresión con varianza alta. Clasificación con varianza alta. Indica con qué métrica para evaluar el rendimiento de modelos de regresión se corresponde la siguiente expresión: Error cuadrático medio. Error absoluto medio. Coeficiente de determinación. Coeficiente de determinación ajustado. Indica qué técnica de evaluación de modelos divide el conjunto de datos original en k subconjuntos y realiza k procesos de entrenamiento y prueba: Método de retención (hold out method). Bagging. Validación cruzada k-fold. Bootstrapping. Indica qué modelo combina las votaciones de varios modelos individuales en el que el peso del voto de cada modelo es el mismo: Bagging. Boosting. Random forest. Decision tree. Indica qué modelo combina las votaciones de varios modelos individuales en el que el peso del voto depende del rendimiento de cada modelo: Bootstrapping. Boosting. Random forest. Decision tree. Indica la fase del modelo CRISP-DM faltante en la siguiente imagen: La comprensión del negocio. La preparación de los datos. El modelado. El despliegue. Indica en qué fase del modelo CRISP-DM se aplican las técnicas de minería de datos a las vistas minables: La comprensión del negocio. La comprensión de los datos. El modelado. El despliegue. Indica qué sistema se encarga de asistir en la producción y es fundamental a la hora de gestionar stocks, cadenas de montaje, necesidad de piezas... CRM. ERP. SCM. Big data. Indica qué modelo de subcontratación de minería de datos consiste en encargar el trabajo a un equipo externo: Compra de las puntuaciones (scores) o predicciones. Compra de modelos. Subcontratación de consultores o expertos en minería de datos. Desarrollo de un programa interno. ¿Qué metodología para el proceso de minería de datos comenzó como un proyecto de la Unión Europea?. KDD. SEMMA. CRISP-DM. DMM. |





