Mineria_DiamantesdeSangre_ju24_22_207_80

COMENTARIOS

ESTADÍSTICAS

RÉCORDS

REALIZAR TEST

Título del Test:

Mineria_DiamantesdeSangre_ju24_22_207_80

Descripción:
Mineria Diamantes de Sangre ju24_22_207_80

Autor:

joseuriarosas@gmail.com

OTROS TESTS DEL AUTOR

Fecha de Creación: 2025/04/08

Categoría: Informática

Número Preguntas: 30

Valoración:

(0)

COMPARTE EL TEST

Nuevo Comentario

Comentarios
NO HAY REGISTROS

Temario:

1. ¿Qué es un data mart?. a. Es un subconjunto de un data warehouse empleado para ayudar a que un área específica dentro del negocio pueda tomar mejores decisiones. b. Es una técnica de preprocesado muy empleada en el ámbito de la minería de datos masivos. c. Es una técnica de procesado no supervisado empleado en campos como la genética. d. Es un evento muy conocido en el ámbito del big data que permite el encuentro de personas de este sector con perfiles profesionales muy diversos.

2. El concepto OLAP se refiere al... a. ... procesamiento analítico de la información en tiempo real. b. ... procesamiento transaccional de la información en tiempo real. c. ... procesamiento de los objetivos de negocio en modo batch. d. ... procesamiento de la información para generar patrones y reglas en el ámbito de big data.

3. Las fases ordenadas en la minería de datos son las siguientes: a. Introducción de datos - exploración y visualización de datos - creación y selección de características - creación y entrenamiento de modelos de aprendizaje automático - implementación y consumo del modelo - revisión y realimentación del modelo. b. Exploración y visualización de datos - introducción de datos - creación y entrenamiento de modelos de aprendizaje automático - nueva exploración y visualización de datos - retroalimentación modelo - implementación y consumo del modelo. c. Introducción de datos - exploración y visualización de datos - creación y selección de características. d. Entendimiento del negocio - exploración de datos - creación y entrenamiento de modelos de aprendizaje automático - anulación modelos sin explicabilidad - implementación y consumo del modelo.

4. La selección del algoritmo de aprendizaje... a. ... no depende del tiempo del que se dispone. b. ... depende del tamaño, la calidad y la naturaleza de los datos. c. ... está predeterminada en función de la evaluación del modelo. d. ... depende del procesamiento previo y limpieza de los datos.

5. Los modelos pueden ser de dos tipos: a. Con variables dependientes e independientes. b. Con variables objetivo o predictivas. c. Predictivos o descriptivos. d. Todas las respuestas son válidas.

6. En todo proceso de data mining es necesario realizar una selección de datos para los análisis posteriores. ¿Qué dos formas de selección de datos existen?. a. Muestreo aleatorio y muestreo estratificado. b. Selección de elementos y selección de atributos o características. c. Eliminación de datos (filas o columnas) y sustitución. d. Selección simple y selección algorítmica (wrappers).

7. La técnica de análisis de componentes principales se utiliza para: a. Explorar los datos de un dataset. b. Realizar un procesado consistente en un análisis no lineal de los datos. c. Reducir la dimensionalidad de un dataset. d. Realizar un procesado consistente en un análisis lineal de los datos.

8. El muestreo por conglomerados... a. ... consiste en seleccionar solo elementos de unos grupos que sean heterogéneos entre sí. b. ... consiste en extraer una muestra balanceada que tenga suficientes elementos de todos los grupos. c. ... se basa en que toda instancia tiene la misma probabilidad de ser extraída de la muestra. d. ... consiste en el muestreo sistemático con arranque aleatorio de dicha muestra.

9. Las estadísticas de los conjuntos de datos que incluyen valores atípicos serán... a. ... independientes de estos. b. ... más realistas al considerar todo tipo de datos y distribución. c. ... necesariamente engañosas. d. ... frecuentemente engañosas.

10. ¿Cuál de las siguientes tareas de minería de datos requiere un valor numérico como salida?. a. Clasificación. b. Clustering. c. Reglas de asociación. d. Regresión.

11. ¿A qué ámbito pertenecen las técnicas de clustering y detección de instancias anómalas?. a. Tareas descriptivas. b. Tareas predictivas. c. Técnicas bayesianas. d. Técnicas de factorización.

12. ¿Dónde ***no*** existe un conocimiento a priori?. a. En el aprendizaje supervisado. b. En el aprendizaje supervisado cuando las variables no están correladas. c. En el aprendizaje no supervisado. d. En todos los aprendizajes.

13. Indica cuál de los siguientes ***no*** es un criterio utilizado para la evaluación de las reglas de asociación: a. Lift. b. Soporte. c. Media móvil. d. Nivel de confianza.

14. Los árboles de decisión... a. ... son muy utilizados para la modelización predictiva. b. ... son fáciles de interpretar. c. ... son resistentes a la persistencia de valores ausentes o missing. d. Todas las respuestas son válidas.

15. El uso del árbol de decisión tiene esta/s utilidad/es: a. Clasificar observaciones. b. Predecir valores. c. Determinar la decisión apropiada. d. Todas las respuestas son válidas.

16. El algoritmo Fuzzy c-Means…. a. … es un algoritmo de inspiración biológica. b. … es un tipo de red neuronal artificial. c. … sirve para la limpieza y el preprocesado de datos. d. … es un algoritmo de lógica difusa.

17. Indica la respuesta más completa. Las redes neuronales sirven…. a. … solo para realizar análisis descriptivos. b. … para realizar aprendizaje supervisado y no supervisado. c. … solo para realizar aprendizaje no supervisado. d. … solo para realizar aprendizaje supervisado.

18. Las máquinas de vectores soporte (SVM) forman parte... a. ... del ámbito de los clasificadores lineales que emplean funciones núcleo o kernel. b. ... del ámbito de las redes neuronales que emplean un perceptrón multicapa. c. ... del ámbito de los algoritmos predictivos que emplean hiperplanos para minimizar el error de predicción. d. ... del ámbito de los algoritmos evolutivos tipo Fuzzy c-Means.

19. ¿A qué método pertenece el algoritmo KNN?. a. Métodos basados en mínimo error cuadrático. b. Métodos basados en el agrupamiento difuso. c. Métodos basados en k-means. d. Métodos basados en casos y vecindad.

20. Los perceptrones multicapa: a. Son redes neuronales artificiales formadas por al menos una capa oculta. b. Están preparados para resolver problemas que son linealmente separables. c. Son un tipo de máquina vector soporte para resolver problemas de regresión. d. Se clasifican dentro de los algoritmos de lógica difusa.

21. Calcula el valor correcto para el indicador de precisión de la siguiente matriz de confusión, considerando los valores «True» como la clase positiva: a. 70 %. b. 65 %. c. 44,8 %. d. 1 %.

22. El aprendizaje colaborativo co-learning también se conoce como: a. Boosting. b. Bagging. c. AdaBoost. d. Co-training.

23. Respecto a la fórmula MSE, selecciona la respuesta más adecuada: a. No pondera los errores de los extremos. b. Realiza ponderaciones. c. Pondera los errores cuadráticos medios. d. No pondera los errores de los extremos ni los medios.

24. Un modelo presenta con los datos de entrenamiento el comportamiento que se aprecia en la imagen. ¿Cómo lo deberías calificar?. a. Es un modelo óptimo, porque se ajusta sin errores a los datos y su comportamiento es a priori una garantía de cara a la generalización para otros datos. b. Es un modelo bastante ineficiente, porque el tiempo de cálculo necesario para ajustarse tanto a los datos y el tiempo dedicado al refinamiento del modelo seguramente no compensará en términos de beneficio. c. Es un modelo enormemente óptimo y, por lo tanto, ya no sería necesario probarlo con datos de test. d. Es un modelo óptimo con los datos de entrenamiento, pero, al favorecer el sobreajuste, seguramente tendrá problemas para generalizar para otros datos.

25. Tableau, Qlik y Pentaho... a. ... son herramientas que, entre sus funcionalidades, nos ayudan a interpretar los modelos mediante la elaboración de cuadros de mando. b. ... son herramientas que ayudan a validar la exactitud de los modelos. c. ... son herramientas que nos ayudan a combinar modelos diferentes creando un nuevo modelo. d. ... son técnicas de aprendizaje híbridas que unifican las ventajas de los métodos de aprendizaje fusionados.

26. El modelo de referencia CRISP-DM tiene seis fases, de las cuales la primera es... a. ... la comprensión del negocio. b. ... la comprensión de los datos. c. No existe una primera fase, ya que el modelo retroalimenta algunas fases. d. El modelo de referencia es una metodología para el proceso de minería de datos y es un proceso iterativo, sin fases.

27. Indica la afirmación más adecuada respecto a las siglas CRM, ERP y SCM: a. Se refieren a herramientas de procesado típicas en big data. b. Son diferentes modelos y guías de referencia para la implantación de big data en un negocio. c. Son subsistemas de empresas con los que típicamente se integran las técnicas de minería de datos. d. Todas las repuestas son erróneas.

28. La implantación de un modelo de minería de datos implica comenzar por... a. ... la preparación de los datos. b. ... el modelado de los datos. c. ... la limpieza de los datos. d. ... la comprensión del negocio.

29. Indica cuál de las siguientes opciones es una metodología estándar de desarrollo de minería de datos: a. KDD. b. KDD-means. c. Semilla. d. DSS.

30. Indica la afirmación que mejor se ajusta a la realidad: a. Las aplicaciones de minería de datos se pueden aplicar prácticamente en cualquier sector. b. La minería de datos no depende del tamaño de la empresa. c. La minería de datos es, por lo general, integrable con la mayoría de los negocios y organizaciones. d. Todas las afirmaciones son correctas.

Denunciar Test

▲