Miner0_d1amant3_jun25-24_o7_o5o
![]() |
![]() |
![]() |
Título del Test:![]() Miner0_d1amant3_jun25-24_o7_o5o Descripción: Miner0 d1amant3 jun2524 o7o5o |




Comentarios |
---|
NO HAY REGISTROS |
Indica en qué fase de la minería de datos se aplican técnicas de reducción de la dimensionalidad que permiten mitigar el problema de la maldición de la dimensionalidad: Introducción de los datos. Preparación de los datos. Creación y selección de características. Implementación del modelo. Indica cuál de las siguientes opciones se corresponde con un conjunto de datos estructurados: Datos históricos de una central meteorológica. Las reseñas de un restaurante en Google. Las imágenes de un telescopio de la NASA. Las publicaciones de un determinado hashtag en X (Twitter). Una empresa de mantenimiento de máquinas industriales desarrolla un modelo que permite determinar si una máquina debe pasar por un proceso de mantenimiento preventivo o no. Indica en qué tipo de tarea de minería de datos se enmarca el problema anterior: Clasificación. Regresión. Clustering. Análisis de correlación. Indica en qué tipo de aprendizaje automático hay un agente que aprende mediante un sistema de recompensas que depende de su actuación: Aprendizaje supervisado. Aprendizaje no supervisado. Aprendizaje por refuerzo. Aprendizaje híbrido. Indica qué herramienta utilizada en minería de datos cuenta con librerías dedicadas al aprendizaje automático como Scikit-learn: KNIME. Python. R. BigML. Indica qué sentencia de Python permite eliminar todos los registros que contengan al menos un valor perdido en un DataFrame llamado «df»: df.dropnull(). df.isnull(). df.dropna(). df.isna(). El INE (Instituto Nacional de Estadística) quiere detectar a partir de qué valores se puede considerar como anómalo un sueldo en España. Se sabe que el primer cuartil es igual a 15 000 € (Q1 = 15 000 €) y el tercer cuartil es igual a 55 000 € (Q3 = 55 000 €). Para detectar los outliers o sueldos anómalos, emplea el método de Tukey con k = 0,25. Indica a partir de qué valores se considera que un sueldo es un outlier: Menos de 7000 € y más de 55 000 €. Menos de 2000 € y más de 50 000 €. Menos de 10 000 € y más de 70 000 €. Menos de 5000 € y más de 65 000 €. Indica con qué tipo de JOIN se combinan únicamente los registros que poseen la misma clave: INNER JOIN. OUTER JOIN. LEFT JOIN. RIGHT JOIN. Dada la siguiente variable: X = [1,8, 0,4, 0,1, 7,9] ¿Cuál de las siguientes opciones corresponde a su estandarización?. [−0,24, −0,68, −0,78, 1,70]. [0,1, 7,9]. [−1,8, −0,4, −0,1, −7,9]. [0,22, 0,04, 0, 1]. Indica qué nombre recibe el gráfico en el que se representan las inercias recogidas por cada una de las componentes principales en un ACP. Scatter plot. Histogram. Scree plot. Box plot. ¿Qué expresión permite calcular el coeficiente de determinación de una regresión lineal?. R^2 = SSR / SST. R^2 = SST / SSR. R^2 = SSE / SST. R^2 = SST / SSE. Una compañía telefónica utiliza una regresión logística múltiple para predecir la baja de sus clientes. De esta forma, puede ofrecer ofertas personalizadas para evitar la marcha de algunos de ellos. Dicho modelo utiliza dos regresores: r1 que mide la antigüedad del cliente en días y r2 que mide el precio de la mensualidad del cliente en euros. Tras ajustar el modelo, sus parámetros son: β0 = −2, β1 = 0,005 y β2 = 0,03. El modelo codifica con 0 la permanencia y con 1 la baja. ¿Se debe ofrecer una oferta personalizada a un cliente que lleva en la compañía tres meses (90 días) y paga al mes 35 €?. Sí, porque p(r1, r2) < 0,5. Sí, porque p(r1, r2) > 0,5. No, porque p(r1, r2) < 0,5. No, porque p(r1, r2) > 0,5. En el contexto de la estadística bayesiana, indica cuál es la expresión de la probabilidad a priori: P(G = k | X = x). P(G = k). P(X = x | G = k). P(X = x). Indica cuál es la expresión de la función núcleo Biweight: a. b. c. d. Se dispone del siguiente árbol de decisión que permite decidir si un paciente está enfermo o no. Dado un nuevo paciente cuyos datos son [ST_Slope = 0,2, MaxHR =87, Cholesterol = 100], indica a qué categoría asigna el modelo al paciente. Heart disease. No heart disease. Lung disease. No lung disease. Indica a qué función de activación corresponde la siguiente función: Tangente hiperbólica. Paraboloide. ReLU. Softmax. (MAL) Dada la función de pérdida C(x,y) = sin(x)cos(x) y un learning rate α = 0,1, calcula el resultado de realizar dos pasos del descenso del gradiente si se parte del punto [x0, y0] = [1,1]: C(x2, y2) = 0,40. C(x2, y2) = 0,39. C(x2, y2) = 0,34. C(x2, y2) = 0,31. ¿En qué tipo de problema es adecuado utilizar la entropía cruzada media (función de pérdida)?. Regresión. Clasificación. Clustering. Análisis de correlación. Indica qué pasaría si en un algoritmo genético se eliminase la fase de mutación. No pasaría nada significativo. La diversidad de las generaciones aumentaría. La diversidad de las generaciones disminuiría. El algoritmo podría escapar de óptimos locales con mayor facilidad. Calcula la distancia de Manhattan de los siguientes dos puntos: P = (5,5,9) Q = (6,1,5). 5,74. 9. 4. 3. Indica qué opción se ajusta a la siguiente imagen: Regresión con sesgo alto. Clasificación con sesgo alto. Regresión con varianza alta. Clasificación con varianza alta. Indica a qué métrica para evaluar el rendimiento de modelos de regresión corresponde la siguiente expresión: Error cuadrático medio. Error absoluto medio. Coeficiente de determinación. Coeficiente de determinación ajustado. Indica qué técnica de evaluación de modelos divide el conjunto de datos disponible en dos subconjuntos (conjunto de entrenamiento y conjunto de prueba): Método de retención (hold out method). Validación cruzada k-fold. Leave-one-out. Bootstrapping. Indica qué modelo combina las votaciones de varios modelos individuales en el que el peso del voto depende del rendimiento de cada modelo: Bootstrapping. Boosting. Random forest. Decision tree. Indica qué modelo combinado asigna iterativamente un peso a cada tupla de forma que el modelo de una iteración presta mayor atención a las tuplas que clasificó incorrectamente el modelo de la iteración anterior: Bootstrapping. Boosting. Random forest. Decision tree. Indica la fase del modelo CRISP-DM faltante en la siguiente imagen: La comprensión del negocio. La preparación de los datos. El modelado. El despliegue. Indica en qué fase del modelo CRISP-DM se analiza la calidad de los datos: La comprensión del negocio. La comprensión de los datos. El modelado. El despliegue. Indica qué sistema se encarga de la interacción de la organización con los proveedores para tratar de maximizar los beneficios, bajando precios y ajustando plazos. CRM. ERP. SCM. Big data. Indica qué modelo de subcontratación de minería de datos se basa en utilizar modelos que han desarrollado organizaciones del mismo sector, bajo el supuesto de que esos modelos difieren poco de los modelos que se podrían desarrollar internamente: Compra de las puntuaciones (scores) o predicciones. Compra de modelos. Subcontratación de consultores o expertos en minería de datos. Desarrollo de un programa interno. ¿Qué metodología para el proceso de minería de datos fue desarrollada en 1996 por Fayyad?. KDD. SEMMA. CRISP-DM. DMM. |