TEST BORRADO, QUIZÁS LE INTERESE: 1-6m
COMENTARIOS | ESTADÍSTICAS | RÉCORDS |
---|
REALIZAR TEST
Título del Test:
1-6m Descripción: cst nrio Autor: . OTROS TESTS DEL AUTOR Fecha de Creación: 20/06/2024 Categoría: Arte Número Preguntas: 59 |
COMPARTE EL TEST
COMENTAR
No hay ningún comentario sobre este test.
Temario:
¿A qué tipo de SVM pertenece el siguiente ejemplo? SVM con función núcleo SVM de margen duro SVM de margen blando. Se dispone de 4 modelos de k vecinos más cercanos(k =1, k = 5, k = 10, k = 15) cuyas curvas ROC son las siguientes: ¿Cuál es el peor modelo teniendo en cuenta lo anteior? k = 1 k = 10 k = 5 k = 15. Indica a qué tipo de JOIN se corresponde el siguiente diagrama: OUTER JOIN RIGHT JOIN LEFT JOIN INNER JOIN. Indica cuál es el esquema básico de un algoritmo genético: generación de la población inicial -> mutación -> selección -> cruce generación de la población inicial -> selección -> cruce -> mutación generación de la población inicial -> cruce -> mutación -> selección generación de la población inicial -> selección -> mutación -> cruce. Calcula la distancia de Manhattan de los siguientes dos puntos de ℝ33: p=(−3,5,2) y q=(3,−5,−2) 12.33 10 20. Se quiere implementar un algoritmo de k-vecinos más cercanos y se desea que el modelo sea bastante flexible. ¿Ǫué valor del parámetro k se debe tomar? Un valor alto Un valor bajo. Indica qué sistema interactúa con los clientes para incrementar los beneficios de la organización: ERP SCM CRM Big data. Dada la siguiente variable: X = [0, 1, 2, 3, 4, 5] ¿Cuál de las siguientes opciones se corresponde a su estandarización? [-0.78, -0.65 , 2.17, -0.38, -0.24, -0.11] [-1.46, -0.87, -0.29, 0.29, 0.87, 1.46] [-1.69, 0.33, -0.67,-0.16, 1.35, 0.84] [-1.46, -0.88, -0.29, 0.29, 0.88, 1.46]. Indica a qué tipo de JOIN se corresponde el siguiente diagrama: RIGHT JOIN OUTER JOIN LEFT JOIN INNER JOIN. ¿Tiene sentido calcular el coeficiente de determinación en una regresión polinómica? No, porque no se cumple la descomposición en sumas de cuadrados Sí, porque la regresión polinómica es un caso concreto de regresión lineal múltiple No, porque no se trata de una regresión lineal Sí, porque el coeficiente de determinación se puede calcular en cualquier tipo de regresión. En un análisis de componentes principales, la i-ésima componente principal ui𝑢𝑖 viene determinada por... ...el autovalor de X^T X asociado al i-ésimo mayor autovector ...el autovector de X^T X asociado al i-ésimo mayor AUTOVALOR. En un problema de regresión, ¿qué función de pérdida eligirías para una red neuronal? CE(w,b)=−1N∑Ni=1∑c∈Ch(ci,c)log(y^i,c)𝐶𝐸(𝑤,𝑏)=−1𝑁∑𝑖=1𝑁∑𝑐∈𝐶ℎ(𝑐𝑖,𝑐)𝑙𝑜𝑔(𝑦^𝑖,𝑐) MSE(w,b)=1N∑Ni=1(yi−y^i)2. Indica a qué métrica para evaluar el rendimiento de modelos de clasificación se corresponde la siguiente expresión: VP+VN / P+N Especificidad Exactitud Tasa de error Sensibilidad. Se dispone del siguiente un árbol de decisión que permite clasificar a pacientes en enfermos y sanos. Dado un nuevo paciente cuyos datos son [chol = 200, trestbps = 150], indica a qué categoría le asigna el modelo. Enfermo Sano. Dado el problema de la aseguradora anterior, ¿qué tipo de aprendizaje automático utilizarías para resolverlo? Aprendizaje no supervisado Aprendizaje supervisado. Indica qué técnica de evaluación de modelos divide el conjunto de datos original en k subconjuntos y realiza k procesos de entrenamiento y prueba: Validación cruzada k-fold Método de retención (hold out method) Bagging Bootstrapping. Indica en qué fase del modelo CRISP-DM se aplican las técnicas de minería de datos a las vistas minables: El modelado El despliegue La comprensión de los datos La comprensión del negocio. Indica qué modelo combina las votaciones de varios modelos individuales en el que el peso del voto de cada modelo ES EL MISMO: Random forest Boosting Decision tree Bagging. El AUC puede tomar valores entre... ...-1 y 1 ...0 y 1 ...0.5 y 1 ...0 y 2. En una destilería de whisky hay un fallo en la máquina de etiquetado. La empresa fabrica 3 tipos de whiskys de diferentes calidades y, por lo tanto, de diferente precios. El problema es que si la empresa vende un whisky de la peor calidad como uno de la mejor, el cliente saldría perjudicado. En cambio, la empresa perdería dinero en el caso contrario. Por esta razón se pretende analizar diferentes variables de cada uno de los whiskys para tratar de agruparlos con la esperanza de que los whiskis de la misma calidad se agrupen juntos y se puedan reetiquetar. ¿A qué tipo de tarea de minería de datos se corresponde el problema anterior? Clasificación Clustering Análisis de correlación Regresión. ¿Ǫué significan las siglas CRM ? Creative Resource Management Critical Response Mechanism Cognitive Recognition Module Customer Relationship Management. Indica en qué tipo de aprendizaje automático hay un entorno y un agente que recibe recompensas en función de su actuación: Aprendizaje supervisado Aprendizaje no supervisado Aprendizaje por refuerzo. Indica cuál es la expresión correcta del coeficiente de determinación: R^2=SST / SSR R^2=SSE / SST R^2=SSR / SST R^2=SST / SSE. Una tabla de Excel es un ejemplo de datos... ... no estructurados ... estructurados. Indica que herramienta utilizada en mineria de datos cuenta con librerías dedicadas al aprendizaje automático como Scikit-learn R KNIME Python BigML. Se dispone del siguiente un árbol de decisión que permite clasificar a pacientes en enfermos y sanos. Dado un nuevo paciente cuyos datos son [chol = 230, trestbps = 120], indica a qué categoría le asigna el modelo. Enfermo Sano. Indica la expresión correcta del teorema de Bayes: A B V D. Se quieren sustituir los valores perdidos de una variable por una medida de tendencia central. El histograma de dicha variable es el siguiente: ¿Cuál de las siguientes medidas de tendencia central es la más adecuada? Varianza Moda Media Mediana. Ǫué fase de la metodología CRISP-DM falta en el siguiente diagrama? Evaluación de los datos Comprensión de los datos Modelado Revisión de los datos . Indica qué sistema se encarga de asistir en la producción y es fundamental a la hora de gestionar stocks, cadenas de montaje, necesidad de piezas… ERP CRM SCM Big Data. Una compañía eléctrica utiliza una regresión logística múltiple para predecir la baja de sus clientes. De esta forma, pueden ofrecer ofertas personalizadas para evitar la marcha de algunos de ellos. Dicho modelo utiliza dos regresores: 𝑟1𝑟1 que mide la antigüedad del cliente en días y 𝑟2𝑟2 que mide el precio de la mensualidad del cliente en euros. Tras ajustar el modelo, sus parámetros son: • 𝛽0=−1.5𝛽0=−1.5 • 𝛽1=0.004𝛽1=0.004 • 𝛽2=0.01𝛽2=0.01 Si el modelo codifica con 0 la permanencia y con 1 la baja, ¿cuál es la probabilidad de baja de un cliente que lleva en la compañía dos años completos (730 días) y paga al mes 55€? 83.27 % 87.76 % 63.77 % 59.74 %. En una base de datos algunos registros tienen las fechas con formato europeo (31/01/2024) y otros con formato americano (01/31/2024). Indica qué factor de calidad de los datos se está viendo afectado en esta situación: Completitud Actualidad Consistencia Precisión. Dado el problema de la destilería de whiskys anterior, ¿qué tipo de aprendizaje automático utilizarías para resolverlo? Aprendizaje supervisado Aprendizaje no supervisado. Indica qué opción se ajusta al siguiente modelo: Regresión con sesgo alto Clasificación con sesgo alto Clasificación con varianza alta Regresión con varianza alta. Una compañía telefónica utiliza una regresión logística múltiple para predecir la baja de sus clientes. De esta forma, pueden ofrecer ofertas personalizadas para evitar la marcha de algunos de ellos. Dicho modelo utiliza tres regresores: 𝑟1𝑟1 que mide la antigüedad del cliente en días, 𝑟2𝑟2 que mide el precio de la mensualidad del cliente en euros y 𝑟3𝑟3 que mide los minutos totales de las llamadas al servicio de atención al cliente. Tras ajustar el modelo, sus parámetros son: • 𝛽0=−3𝛽0=−3 • 𝛽1=0.001𝛽1=0.001 • 𝛽2=0.01𝛽2=0.01 • 𝛽2=0.005𝛽2=0.005 Si el modelo codifica con 0 la permanencia y con 1 la baja, ¿cuál es la probabilidad de baja de un cliente que lleva en la compañía un año completo (365 días), paga al mes 25€ y ha pasado 300 minutos hablando con el servicio de atención al cliente? 29.21 % 33.56 % 15.82 % 70.55 %. ¿Qué fase de la metodología CRISP-DM falta en el siguiente diagrama? Revisión Producción Despliegue Puesta a punto. Se quieren sustituir los valores perdidos de una variable por una medida de tendencia central. El histograma de dicha variable es el siguiente: ¿Cuál de las siguientes medidas de tendencia central es la más adecuada? Media Mediana Moda Varianza. Calcula la salida de un perceptrón simple con pesos 𝑤=[2,1,3]𝑇𝑤=[2,1,3]𝑇, sesgo 𝑏=−6 y función de activación ReLU que recibe el vector de entrada 𝑥=[1,0,1]𝑇. -1 1 0. Dada la función de pérdida 𝐶(𝑥,𝑦)=𝑥2+𝑦2𝐶(𝑥,𝑦)=𝑥2+𝑦2 y un learning rate 𝛼=0.1𝛼=0.1, calcula el resultado de realizar dos pasos del descenso del gradiente si se parte del punto (𝑥0,𝑦0)=(1,1)(𝑥0,𝑦0)=(1,1). 0.25 0.8 0.76 0.64 . ¿Qué significan las siglas ERP? Enterprise Response Protocol Enterprise Research Platform Enterprise Resource Planning Enterprise Renewal Program. ¿Qué implementación del descenso del gradiente actualiza el gradiente con cada dato de entrenamiento? Estocástico Mini-batch Batch. Una aseguradora quiere estimar el nivel de riesgo de cada cliente para poder ofrecer polizas personalizadas. ¿A qué tipo de tarea de minería de datos se corresponde el problema anterior? Análisis de correlación Clasificación Regresión Clustering. Indica qué opción se ajusta el siguiente modelo: Clasificación con sesgo alto Regresión con sesgo alto Regresión con varianza alta Clasificación con varianza alta. Indica cuál de las siguientes opciones se corresponde con la primera fase del proceso de minería de datos: Introducción de los datos Preparación de los datos Revisión de los modelos Creación y entrenamiento de los modelos. Indica qué modelo de subcontratación de minería de datos la organización tiene control total sobre el proceso: Compra de modelos Subcontratación de consultores o expertos en minería de datos Desarrollo de un programa interno Compra de las puntuaciones (scores) o predicciones. ¿Qué familia de modelos presupone que los datos analizdos siguen un cierto modelo matemático? Modelos no paramétricos Modelos paramétricos. Indica qué modelo de subcontratación de minería de datos consiste en aplicaciones particulares del negocio que automatizan ciertos procesos: Mediante la compra de software específico Subcontratación de consultores o expertos en minería de datos Compra de las puntuaciones (scores) o predicciones Desarrollo de un programa interno. Indica que herramienta utilizada en minería de datos permite crear workflows mediante la combinación de nodos y flechas: Python BigML KNIME R. Indica a qué estrategia de combinación de modelos se corresponde el siguiente diagrama: Baggíng Decision tree Boosting Random forest. En un problema de clasificación de más de dos clases, ¿qué función de activación eligierías para la última capa de una red neuronal? Softmax Sigmoide ReLU Tangente hiperbólica. Al implementar un algoritmo genético te das cuenta de que converge demasiado rápido a un óptimo local y, por lo tanto, las soluciones a las que llega no son suficientemente buenas. ¿Que harías para solucionarlo? Elegir la selección por torneo como mecanismo de selección Elegir la selección por truncamiento como mecanismo de selección Generar individuos similares en la población inicial Disminuir el tamaño de la población. Los árboles de decisión pertenecen a la familia de los modelos... ..paramétrico de regresión ..paramétricos de clasificación ..no paramétricos de regresión ..no paramétricos de clasificación. Indica cuál de las siguientes opciones no es un factor influyente en la calidad de los datos: Rastreabilidad Precisión Completitud Verosimilitud. En términos Bayesianos, P(G = k| X = x) recibe el nombre de... ..verosimilitud ..evidencia ..probabilidad a posteriori ..probabilidad a priori. Indica en qué fase del modelo CRISP-DM tiene como objetivo obtener la vista minable de los datos: La comprensión de los datos Preparación de los datos El modelado Evaluación. Al implementar un algoritmo genético te das cuenta de que converge demasiado rápido a un óptimo local y, por lo tanto, las soluciones a las que llega no son suficientemente buenas. ¿Que harías para solucionarlo? Elegir la selección por truncamiento como mecanismo de selección Generar individuos similares en la población inicial Elegir la selección por torneo como mecanismo de selección Disminuir el tamaño de la población. Dada la siguiente variable: X= [2,7,6, 5, 9,12] ¿Cuál de las siguientes opciones se corresponde a su normalización min-max? [0.8, 0.2, 0.4, 0.3, 0.7, 1] [0, 0.5, 0.4, 0.3, 0.7, 1] [5, 2, 7, 4, 6, 9] [0, 0.2, 0.4, 0.5, 0.7, 1]. Indica a qué métrica para evaluar el rendimiento de modelos de clasificación se corresponde la siguiente expresión: Sensibilidad Especificidad Tasa de error Exactitud. Indica qué técnica de evaluación de modelos utiliza submuestras con reemplazamiento para estimar la distribución del rendimiento: Método de retención (hold out method) Bootstrapping Validación cruzada k-fold Leave-one-out. |
Denunciar Test