MDeIAC 2306620
![]() |
![]() |
![]() |
Título del Test:![]() MDeIAC 2306620 Descripción: Min. datos. ia cor. junio 2024 |




Comentarios |
---|
NO HAY REGISTROS |
Indica en qué fase de la minería de datos se cargan los datos provenientes de diferentes fuentes: Introducción de los datos. Preparación de los datos. Creación y selección de características. Implementación del modelo. Indica cuál de las siguientes opciones se corresponde con un conjunto de datos estructurados: Las fotografías de un dron militar. Las reseñas de una película en IMDB. Una tabla de Excel con los datos de las ventas de una pequeña empresa de e-commerce. Las publicaciones de un usuario en Instagram. Una empresa de reparación de ordenadores desarrolla un modelo para estimar el tiempo de vida restante del disco duro de un ordenador. Indica en qué tipo de tarea de minería de datos se enmarca el problema anterior: Clasificación. Regresión. Clustering. Análisis de correlación. Indica qué tipo de aprendizaje automático trabaja con datos etiquetados: Aprendizaje supervisado. Aprendizaje no supervisado. Aprendizaje por refuerzo. Aprendizaje híbrido. Indica qué herramienta utilizada en minería de datos permite crear workflows mediante la combinación de nodos y flechas: KNIME. Python. R. BigML. Se quieren sustituir los valores perdidos de una variable por una medida de tendencia central. El histograma de dichas variables es el siguiente: ¿Cuál de las siguientes medidas de tendencia central es la más adecuada?. Media. Mediana. Moda. Varianza. Una entidad bancaria quiere detectar qué cantidad de transacciones mensuales se puede considerar como anómala. Se sabe que el primer cuartil es igual a 10 transacciones (Q1 = 10) y el tercer cuartil es igual a 20 transacciones (Q3 = 20). Para detectar los outliers se emplea el método de Tukey con k = 1.5. Indica qué número de transacciones se considera un outlier. Para ello, considera únicamente el extremo superior del intervalo. Más de 30 transacciones. Más de 15 transacciones. Más de 20 transacciones. Más de 35 transacciones. Indica con qué tipo de JOIN se mantienen los registros de la tabla A y aquellos registros de la tabla B que tienen correspondencia en la tabla A: INNER JOIN. OUTER JOIN. LEFT JOIN. RIGHT JOIN. Dada la siguiente variable: X = [1.8, 0.4, 0.1, 7.9] ¿Cuál de las siguientes opciones se corresponde con su normalización min-max?. [0.1, 7.9]. [−0.24, −0.68, −0.78, 1.70]. [0.22, 0.04, 0, 1]. [−1.8, −0.4, −0.1, −7.9]. Dado el siguiente scree plot: Indica cuántas componentes principales hay que tomar para retener al menos el 90 % de la inercia total: Tres. Cuatro. Cinco. Seis. ¿Qué expresión permite calcular el vector de parámetros de una regresión lineal, ya sea simple o múltiple?. b = (Y^t Y)^-1 + Y^t X. b = (Y^-1 Y)^t + Y^-1 X. b = (X^-1 X)^t + X^-1 Y. b = (X^t X)^-1 X^t Y. Una compañía telefónica utiliza una regresión logística múltiple para predecir la baja de sus clientes. De esta forma, pueden ofrecer ofertas personalizadas para evitar la marcha de algunos de ellos. Dicho modelo utiliza dos regresores: r1 que mide la antigüedad del cliente en días y r2 que mide el precio de la mensualidad del cliente en euros. Tras ajustar el modelo, sus parámetros son: β0 = −2, β1 = 0.003 y β2 = 0.02. El modelo codifica con 0 la permanencia y con 1 la baja. ¿Se debe ofrecer una oferta personalizada a un cliente que lleva en la compañía un año completo (365 días) y paga al mes 65 €?. Sí, porque p(r1, r2) < 0.5. Sí, porque p(r1, r2) > 0.5. No, porque p(r1, r2) < 0.5. No, porque p(r1, r2) > 0.5. En el contexto de la estadística bayesiana, indica cuál es la expresión de la probabilidada posteriori: P(G = g | X = x). P(G = g). P(X = x | G = g). P(X = x). Indica cuál es la expresión de la función núcleo Gaussiano: K(x) = 1/2 * I[-1,1](x). K(x) = 1/sqrt(2*pi) * e^(-x^2 / 2). K(x) = 3/4 * (1 - x^2) * I[-1,1](x). K(x) = 15/16 * (1 - x^2)^2 * I[-1,1](x). Se dispone del siguiente un árbol de decisión que permite clasificar 4 tipos de flores: setosa, versicolor, virgínica y lirio. Dada una nueva flor cuyos datos son [petal_width = 1.5, petal_length = 5], indica a qué categoría asigna el modelo la flor. Setosa. Versicolor. Virginica. Lirio. Indica a qué función de activación corresponde la siguiente función: Tangente hiperbólica. Sigmoide. ReLU. Softmax. Dada la función de pérdida C(x,y) = x·y2 y un learning rate α = 0.1, calcula el resultado de realizar dos pasos del descenso del gradiente si se parte del punto [x0, y0] = [2,2]: C(x2, y2) = 0,13. C(x2, y2) = 0,97. C(x2, y2) = 0,52. C(x2, y2) = 2,30. ¿En qué tipo de problema es adecuado utilizar el error cuadrático medio (función de pérdida)?. Regresión. Clasificación. Clustering. Análisis de correlación. Los algoritmos genéticos son…. … algoritmos de aprendizaje automático diseñados para resolver problemas de regresión. … algoritmos de aprendizaje automático diseñados para resolver problemas de clasificación. … algoritmos de optimización que garantizan alcanzar la solución óptima en un tiempo finito. ... metaheurísticas pertenecientes a la familia de los algoritmos evolutivos. Calcula la distancia euclídea de los siguientes dos puntos: P =(3,1,9) Q =(1,7,5). 7,48. 12. 6. 6,25. Indica qué opción se ajusta a la siguiente imagen: Regresión con sesgo alto. Clasificación con sesgo alto. Regresión con varianza alta. Clasificación con varianza alta. Indica a qué métrica para evaluar el rendimiento de los modelos de regresión se corresponde la siguiente expresión: Error cuadrático medio. Error absoluto medio. Coeficiente de determinación. Coeficiente de determinación ajustado. Indica qué técnica de evaluación de modelos utiliza submuestras con reemplazamiento para estimar la distribución del rendimiento: Método de retención (hold out method). Validación cruzada k-fold. Leave-one-out. Bootstrapping. Indica qué modelo consiste en la combinación de árboles de decisión mediante bagging y la selección aleatoria de atributos: Bootstrapping. Boosting. Random forest. Decision tree. Indica qué modelo combinado asigna iterativamente un peso a cada tupla de forma que el modelo de una iteración presta mayor atención a las tuplas que clasificó incorrectamente el modelo de la iteración anterior: Bootstrapping. Boosting. Random forest. Decision tree. Indica la fase faltante del modelo CRISP-DM en la siguiente imagen: La comprensión del negocio. La preparación de los datos. El modelado. El despliegue. Indica qué fase del modelo CRISP-DM se centra en entender los objetivos y requerimientos del proyecto desde una perspectiva de negocio: La comprensión del negocio. La comprensión de los datos. El modelado. El despliegue. Indica qué sistema se encarga de almacenar grandes volúmenes de datos estructurados y no estructurados que proceden de una gran variedad de fuentes: CRM. ERP. SCM. Big data. Indica qué modelo de subcontratación de minería de datos se basa en que la empresa proporcione las preguntas y una consultora externa las responda utilizando para ello sus modelos: Compra de las puntaciones (scores) o predicciones. Compra de modelos. Subcontratación de consultores o expertos en minería de datos. Desarrollo de un programa interno. ¿Qué metodología para el proceso de minería de datos fue desarrollada en 1996 por SAS Institute Inc.?. KDD. SEMMA. CRISP-DM. DMM. |