Test de evalución MDeIAC
![]() |
![]() |
![]() |
Título del Test:![]() Test de evalución MDeIAC Descripción: Test de evaluación por orden (las 30 últimas son cinco de cada tema) |




Comentarios |
---|
NO HAY REGISTROS |
Indica cuál de las siguientes opciones se corresponde con la primera fase del proceso de minería de datos: Creación y entrenamiento de los modelos. Preparación de los datos. Introducción de los datos. Revisión de los modelos. Un conjunto de tweets sobre un tema concreto es un ejemplo de datos.... ... no estructurados. ... estructurados. Una tabla de Excel es un ejemplo de datos... . ... no estructurados. ... estructurados. En una destilería de whisky hay un fallo en la máquina de etiquetado. La empresa fabrica 3 tipos de whiskys de diferentes calidades y, por lo tanto, de diferente precios. El problema es que si la empresa vende un whisky de la peor calidad como uno de la mejor, el cliente saldría perjudicado. En cambio, la empresa perdería dinero en el caso contrario. Por esta razón se pretende analizar diferentes variables de cada uno de los whiskys para tratar de agruparlos con la esperanza de que los whiskis de la misma calidad se agrupen juntos y se puedan reetiquetar. ¿A qué tipo de tarea de minería de datos se corresponde el problema anterior?. Clasificación. Clustering. Regresión. Análisis de correlación. Una aseguradora quiere estimar el nivel de riesgo de cada cliente para poder ofrecer polizas personalizadas. ¿A qué tipo de tarea de minería de datos se corresponde el problema anterior?. Análisis de correlación. Clustering. Clasificación. Regresión. Dado el problema de la destilería de whiskys anterior, ¿qué tipo de aprendizaje automático utilizarías para resolverlo?. Aprendizaje supervisado. Aprendizaje no supervisado. Dado el problema de la aseguradora anterior, ¿qué tipo de aprendizaje automático utilizarías para resolverlo?. Aprendizaje supervisado. Aprendizaje no supervisado. Indica en qué tipo de aprendizaje automático hay un entorno y un agente que recibe recompensas en función de su actuación: Aprendizaje no supervisado. Aprendizaje supervisado. Aprendizaje por refuerzo. Indica que herramienta utilizada en minería de datos permite crear workflows mediante la combinación de nodos y flechas: R. Python. KNIME. BigML. Indica que herramienta utilizada en mineria de datos cuenta con librerías dedicadas al aprendizaje automático como Scikit-learn: KNIME. Python. BigML. R. Dada la función de pérdida C(x,y)=x^2+y^2 y un learning rate α=0.1 , calcula el resultado de realizar dos pasos del descenso del gradiente si se parte del punto (x0,y0)=(1,1) . 0.76. 0.64. 0.25. 0.8. ¿Qué implementación del descenso del gradiente actualiza el gradiente con cada dato de entrenamiento?. Mini-batch. Batch. Estocástico. ¿A qué tipo de SVM pertenece el siguiente ejemplo?. SVM de margen duro. SVM de margen blando. SVM con función núcleo. Se quiere implementar un algoritmo de k-vecinos más cercanos y se desea que el modelo sea bastante flexible. ¿Qué valor del parámetro k se debe tomar?. Un valor bajo. Un valor alto. Al implementar un algoritmo genético te das cuenta de que converge demasiado rápido a un óptimo local y, por lo tanto, las soluciones a las que llega no son suficientemente buenas. ¿Que harías para solucionarlo?. Disminuir el tamaño de la población. Elegir la selección por torneo como mecanismo de selección. Generar individuos similares en la población inicial. Elegir la selección por truncamiento como mecanismo de selección. En un problema de regresión, ¿qué función de pérdida eligirías para una red neuronal?. CE(w,b)=−1/N ∑Ni=1∑c∈Ch(ci,c)log(y'i,c). MSE(w,b)=1/N ∑Ni=1(yi−y'i)^2. En un problema de clasificación de más de dos clases, ¿qué función de activación eligierías para la última capa de una red neuronal?. ReLU. Softmax. Sigmoide. Tangente hiperbólica. Calcula la distancia de Manhattan de los siguientes dos puntos de ℝ^3: p=(−3,5,2) y q=(3,−5,−2). 10. 20. 12.33. Indica cuál es el esquema básico de un algoritmo genético: generación de la población inicial -> selección -> mutación -> cruce. generación de la población inicial -> selección -> cruce -> mutación. generación de la población inicial -> mutación -> selección -> cruce. generación de la población inicial -> cruce -> mutación -> selección. Calcula la salida de un perceptrón simple con pesos w=[2,1,3]^T, sesgo b=−6 y función de activación ReLU que recibe el vector de entrada x=[1,0,1]^T. 0. 1. -1. En un análisis de componentes principales, la inercia explicada por la i-ésima componente principal ui viene determinada por... ...el autovector de X^T * X asociado al i-ésimo mayor autovalor. ...el i-éismo mayor autovalor de X^T * X. En una base de datos algunos registros tienen las fechas con formato europeo (31/01/2024) y otros con formato americano (01/31/2024). Indica qué factor de calidad de los datos se está viendo afectado en esta situación: Consistencia. Actualidad. Completitud. Precisión. Indica a qué tipo de JOIN se corresponde el siguiente diagrama: LEFT JOIN. OUTER JOIN. INNER JOIN. RIGHT JOIN. Dada la siguiente variable: X = [0, 1, 2, 3, 4, 5] ¿Cuál de las siguientes opciones se corresponde a su estandarización?. [-1.46, -0.88, -0.29, 0.29, 0.88, 1.46]. [-1.46, -0.87, -0.29, 0.29, 0.87, 1.46]. [-0.78, -0.65 , 2.17, -0.38, -0.24, -0.11]. [-1.69, 0.33, -0.67,-0.16, 1.35, 0.84]. Se quieren sustituir los valores perdidos de una variable por una medida de tendencia central. El histograma de dicha variable es el siguiente: Varianza. Mediana. Moda. Media. Se dispone del siguiente un árbol de decisión que permite clasificar a pacientes en enfermos y sanos. Dado un nuevo paciente cuyos datos son [chol = 230, trestbps = 120], indica a qué categoría le asigna el modelo. Enfermo. Sano. ¿Qué familia de modelos presupone que los datos analizdos siguen un cierto modelo matemático?. Modelos no paramétricos. Modelos paramétricos. En términos Bayesianos, P(G=k|X=x) recibe el nombre de... ...evidencia. ...probabilidad a priori. ...probabilidad a posteriori. ...verosimilitud. Una compañía telefónica utiliza una regresión logística múltiple para predecir la baja de sus clientes. De esta forma, pueden ofrecer ofertas personalizadas para evitar la marcha de algunos de ellos. Dicho modelo utiliza tres regresores: r1 que mide la antigüedad del cliente en días, r2 que mide el precio de la mensualidad del cliente en euros y r3 que mide los minutos totales de las llamadas al servicio de atención al cliente. Tras ajustar el modelo, sus parámetros son: β0=−3 β1=0.001 β2=0.01 β2=0.005 Si el modelo codifica con 0 la permanencia y con 1 la baja, ¿cuál es la probabilidad de baja de un cliente que lleva en la compañía un año completo (365 días), paga al mes 25€ y ha pasado 300 minutos hablando con el servicio de atención al cliente?. 33.56 %. 15.82 %. 70.55 %. 29.21 %. Indica cuál es la expresión correcta del coeficiente de determinación: R^2=SSE/SST. R^2=SST/SSE. R^2=SST/SSR. R^2=SSR/SST. Indica cuál es el esquema básico de un algoritmo genético: generación de la población inicial -> selección -> cruce -> mutación. generación de la población inicial -> mutación -> selección -> cruce. generación de la población inicial -> cruce -> mutación -> selección. generación de la población inicial -> selección -> mutación -> cruce. Dada la función de pérdida C(x,y)=x^2+y^2 y un learning rate α=0.1 , calcula el resultado de realizar dos pasos del descenso del gradiente si se parte del punto (x0,y0)=(1,1) . C(0.76, 0.76) = 1.1. C(0.25, 0.25) = 0.37. C(0.64, 0.64) = 0.819. C(0.8, 0.8) = 1.28. En un problema de clasificación de más de dos clases, ¿qué función de activación eligierías para la última capa de una red neuronal?. Sigmoide. Softmax. ReLU. Tangente hiperbólica. Se quiere implementar un algoritmo de k-vecinos más cercanos y se desea que el modelo sea bastante flexible. ¿Qué valor del parámetro k se debe tomar?. Un valor bajo. Un valor alto. ¿A qué tipo de SVM pertenece el siguiente ejemplo??. SVM de margen duro. SVM de margen blando. SVM con función núcleo. Indica a qué estrategia de combinación de modelos se corresponde el siguiente diagrama: Boosting. Decision tree. Random forest. Bagging. Indica a qué métrica para evaluar el rendimiento de modelos de clasificación se corresponde la siguiente expresión: VP+VN / P+N. Especificidad. Exactitud. Sensibilidad. Tasa de error. Indica qué opción se ajusta al siguiente modelo: Clasificación con varianza alta. Clasificación con sesgo alto. Regresión con sesgo alto. Regresión con varianza alta. Indica qué técnica de evaluación de modelos divide el conjunto de datos original en k subconjuntos y realiza k procesos de entrenamiento y prueba: Método de retención (hold out method). Bootstrapping. Validación cruzada k-fold. Bagging. Indica qué técnica de evaluación de modelos utiliza submuestras con reemplazamiento para estimar la distribución del rendimiento: Leave-one-out. Bootstrapping. Método de retención (hold out method). Validación cruzada k-fold. Indica qué sistema interactúa con los clientes para incrementar los beneficios de la organización: ERP. SCM. CRM. Big data. ¿Qué significan las siglas ERP?. Enterprise Renewal Program. Enterprise Resource Planning. Enterprise Research Platform. Enterprise Response Protocol. Indica en qué fase del modelo CRISP-DM tiene como objetivo obtener la vista minable de los datos: Preparación de los datos. La comprensión de los datos. El modelado. Evaluación. ¿Qué fase de la metodología CRISP-DM falta en el siguiente diagrama?. El monitoreo posterior al despliegue. La definición de métricas de negocio. La validación cruzada de modelos. Modelado. Indica qué modelo de subcontratación de minería de datos consiste en aplicaciones particulares del negocio que automatizan ciertos procesos: Compra de las puntuaciones (scores) o predicciones. Mediante la compra de software específico. Subcontratación de consultores o expertos en minería de datos. Desarrollo de un programa interno. Indica cuál de las siguientes opciones se corresponde con la primera fase del proceso de minería de datos: Revisión de los modelos. Creación y entrenamiento de los modelos. Introducción de los datos. Preparación de los datos. Indica que herramienta utilizada en minería de datos permite crear workflows mediante la combinación de nodos y flechas: R. BigML. KNIME. Python. En una destilería de whisky hay un fallo en la máquina de etiquetado. La empresa fabrica 3 tipos de whiskys de diferentes calidades y, por lo tanto, de diferente precios. El problema es que si la empresa vende un whisky de la peor calidad como uno de la mejor, el cliente saldría perjudicado. En cambio, la empresa perdería dinero en el caso contrario. Por esta razón se pretende analizar diferentes variables de cada uno de los whiskys para tratar de agruparlos con la esperanza de que los whiskis de la misma calidad se agrupen juntos y se puedan reetiquetar. ¿A qué tipo de tarea de minería de datos se corresponde el problema anterior?. Clustering. Regresión. Análisis de correlación. Clasificación. Dado el problema de la destilería de whiskys anterior, ¿qué tipo de aprendizaje automático utilizarías para resolverlo?. Aprendizaje no supervisado. Aprendizaje supervisado. Un conjunto de tweets sobre un tema concreto es un ejemplo de datos... ... no estructurados. ... estructurados. |