option
Cuestiones
ayuda
daypo
buscar.php

Mineria de datos

COMENTARIOS ESTADÍSTICAS RÉCORDS
REALIZAR TEST
Título del Test:
Mineria de datos

Descripción:
Test Final UD6 corregido

Fecha de Creación: 2025/06/18

Categoría: Informática

Número Preguntas: 30

Valoración:(0)
COMPARTE EL TEST
Nuevo ComentarioNuevo Comentario
Comentarios
NO HAY REGISTROS
Temario:

En un análisis de componentes principales, la inercia explicada por la i-ésima componente principal ui viene determinada por... A. B.

En una base de datos algunos registros tienen las fechas con formato europeo (31/01/2024) y otros con formato americano (01/31/2024). Indica qué factor de calidad de los datos se está viendo afectado en esta situación: Completitud. Actualidad. Precisión. Consistencia.

Indica a qué tipo de JOIN se corresponde el siguiente diagrama: OUTER JOIN. LEFT JOIN. RIGHT JOIN. INNER JOIN.

Dada la siguiente variable: X = [0, 1, 2, 3, 4, 5] ¿Cuál de las siguientes opciones se corresponde a su estandarización?. A. B. C. D.

Se quieren sustituir los valores perdidos de una variable por una medida de tendencia central. El histograma de dicha variable es el siguiente: Mediana. Moda. Varianza. Media.

Se dispone del siguiente un árbol de decisión que permite clasificar a pacientes en enfermos y sanos. Dado un nuevo paciente cuyos datos son [chol = 230, trestbps = 120], indica a qué categoría le asigna el modelo. Sano. Enfermo.

¿Qué familia de modelos presupone que los datos analizdos siguen un cierto modelo matemático?. Modelos no paramétricos. Modelos paramétricos.

En términos Bayesianos, recibe el nombre de: verosimilitud. evidencia. probabilidad a posteriori. probabilidad a priori.

Una compañía telefónica utiliza una regresión logística múltiple para predecir la baja de sus clientes. De esta forma, pueden ofrecer ofertas personalizadas para evitar la marcha de algunos de ellos. Dicho modelo utiliza tres regresores: r1 que mide la antigüedad del cliente en días, r2 que mide el precio de la mensualidad del cliente en euros y r3 que mide los minutos totales de las llamadas al servicio de atención al cliente. Tras ajustar el modelo, sus parámetros son: Si el modelo codifica con 0 la permanencia y con 1 la baja, ¿cuál es la probabilidad de baja de un cliente que lleva en la compañía un año completo (365 días), paga al mes 25€ y ha pasado 300 minutos hablando con el servicio de atención al cliente?. 29.21 %. 70.55 %. 15.82 %. 33.56 %.

Indica cuál es la expresión correcta del coeficiente de determinación: A. B. C. D.

Indica cuál es el esquema básico de un algoritmo genético: generación de la población inicial -> selección -> mutación -> cruce. generación de la población inicial -> mutación -> selección -> cruce. generación de la población inicial -> selección -> cruce -> mutación. generación de la población inicial -> cruce -> mutación -> selección.

Dada la función de pérdida C(x,y)=x2+y2 y un learning rate α=0.1, calcula el resultado de realizar dos pasos del descenso del gradiente si se parte del punto (x0,y0)=(1,1). C(0.8, 0.8) = 1.28. C(0.64, 0.64) = 0.819. C(0.76, 0.76) = 1.1. C(0.25, 0.25) = 0.37.

En un problema de clasificación de más de dos clases, ¿qué función de activación eligierías para la última capa de una red neuronal?. Tangente hiperbólica. Sigmoide. Softmax. ReLU.

Se quiere implementar un algoritmo de k-vecinos más cercanos y se desea que el modelo sea bastante flexible. ¿Qué valor del parámetro k se debe tomar?. Un valor bajo. Un valor alto.

¿A qué tipo de SVM pertenece el siguiente ejemplo?. SVM con función núcleo. SVM de margen duro. SVM de margen blando.

Indica a qué estrategia de combinación de modelos se corresponde el siguiente diagrama: Bagging. Decision tree. Boosting. Random forest.

Indica a qué métrica para evaluar el rendimiento de modelos de clasificación se corresponde la siguiente expresión: Exactitud. Especificidad. Sensibilidad. Tasa de error.

Indica qué opción se ajusta al siguiente modelo: Regresión con varianza alta. Clasificación con sesgo alto. Regresión con sesgo alto. Clasificación con varianza alta.

Indica qué técnica de evaluación de modelos divide el conjunto de datos original en k subconjuntos y realiza k procesos de entrenamiento y prueba: Método de retención (hold out method). Validación cruzada k-fold. Bootstrapping. Bagging.

Indica qué técnica de evaluación de modelos utiliza submuestras con reemplazamiento para estimar la distribución del rendimiento: Leave-one-out. Método de retención (hold out method). Validación cruzada k-fold. Bootstrapping.

Indica qué sistema interactúa con los clientes para incrementar los beneficios de la organización: CRM. SCM. Big data. ERP.

¿Qué significan las siglas ERP?. Enterprise Response Protocol. Enterprise Renewal Program. Enterprise Research Platform. Enterprise Resource Planning.

Indica en qué fase del modelo CRISP-DM tiene como objetivo obtener la vista minable de los datos: El modelado. La comprensión de los datos. Preparación de los datos. Evaluación.

¿Qué fase de la metodología CRISP-DM falta en el siguiente diagrama?. El monitoreo posterior al despliegue. Modelado. La definición de métricas de negocio. La validación cruzada de modelos.

Indica qué modelo de subcontratación de minería de datos consiste en aplicaciones particulares del negocio que automatizan ciertos procesos: Compra de las puntuaciones (scores) o predicciones. Subcontratación de consultores o expertos en minería de datos. Desarrollo de un programa interno. Mediante la compra de software específico.

Indica cuál de las siguientes opciones se corresponde con la primera fase del proceso de minería de datos: Revisión de los modelos. Preparación de los datos. Introducción de los datos. Creación y entrenamiento de los modelos.

Indica que herramienta utilizada en minería de datos permite crear workflows mediante la combinación de nodos y flechas: BigML. R. KNIME. Python.

En una destilería de whisky hay un fallo en la máquina de etiquetado. La empresa fabrica 3 tipos de whiskys de diferentes calidades y, por lo tanto, de diferente precios. El problema es que si la empresa vende un whisky de la peor calidad como uno de la mejor, el cliente saldría perjudicado. En cambio, la empresa perdería dinero en el caso contrario. Por esta razón se pretende analizar diferentes variables de cada uno de los whiskys para tratar de agruparlos con la esperanza de que los whiskis de la misma calidad se agrupen juntos y se puedan reetiquetar. ¿A qué tipo de tarea de minería de datos se corresponde el problema anterior?. Regresión. Análisis de correlación. Clustering. Clasificación.

Dado el problema de la destilería de whiskys anterior, ¿qué tipo de aprendizaje automático utilizarías para resolverlo?. Aprendizaje supervisado. Aprendizaje no supervisado.

Un conjunto de tweets sobre un tema concreto es un ejemplo de datos... estructurados. no estructurados.

Denunciar Test