Test Big Data Aplicado Tema 5
|
|
Título del Test:
![]() Test Big Data Aplicado Tema 5 Descripción: Preguntas de Big Data Aplicado Tema 5 |



| Comentarios |
|---|
NO HAY REGISTROS |
|
¿Cómo se llaman los datos que llegan a un Data Lake y que son almacenados tal cual, sin ser transformados?: Refined data. Datos de origen. Raw data. Golden source. Una de las primeras tareas que hay que realizar para implantar un clúster Hadoop es diseñar los procesos de ETL. ¿Verdadero o falso?. Verdadero. Falso. Un plan de capacidad requiere conocer qué necesidades de datos tendrá una plataforma. ¿Verdadero o falso?. Verdadero. Falso. ¿Qué tipo de datos gestiona un Datawarehouse?: Datos estructurados. Datos no estructurados. Datos semi-estructurados. Cualquier tipo de datos. ¿Cómo se llaman las herramientas que preparan los datos para el Datawarehouse?: Herramientas de Data Governance. Herramientas de ETL. Herramientas de Data Discovery. El Datawarehouse no requiere una preparación previa de los datos. Data Mesh es un concepto que ha aparecido después que el concepto de Data Lake. ¿Verdadero o falso?. Verdadero. Falso. Una vez instalado un Hadoop on-premise, es necesario hacer optimizarlo o tunearlo para obtener el máximo rendimiento. ¿Verdadero o falso?. Verdadero. Falso. Uno de los principales problemas de Data Lake frente a Data Mesh es que es más difícil de escalar. ¿Verdadero o falso?. Verdadero. Falso. En la adopción de un Hadoop on-premise, no es muy importante dimensionar adecuadamente la plataforma porque es escalable. ¿Verdadero o falso?. Verdadero. Falso. Uno de los beneficios de los Data Lakes frente a los Datawarehouses es que permiten procesar cualquier tipo de dato, no sólo datos estructurados. ¿Verdadero o falso?. Verdadero. Falso. Un Data Lake no ofrece herramientas de explotación de los datos, esta responsabilidad recae en los usuarios. ¿Verdadero o falso?. Verdadero. Falso. Las tecnologías Big Data se empezaron a probar porque los equipos de tecnología vieron la capacidad de resolver casos de uso para el negocio. ¿Verdadero o falso?. Verdadero. Falso. Las soluciones de Hadoop como servicio son todavía poco maduras. ¿Verdadero o falso?. Verdadero. Falso. ¿A qué se refiere el concepto "industrialización" en relación con las actividades de ingeniería de datos?: A aplicar tecnologías Big Data en el sector industrial. A llevar todas las plataformas a la nube. A estandarizar y automatizar todo lo posible las tareas para ganar eficiencia. A aplicar mecanismos de control y validación de la calidad. Data Governance es el conjunto de procesos, roles, políticas, estándares y métricas que garantizan el uso eficiente y efectivo de los datos, alineado con los objetivos de las empresas. ¿Verdadero o falso?. Verdadero. Falso. En un entorno multitenancy es importante definir una estructura de directorios clara. ¿Verdadero o falso?. Verdadero. Falso. Una de las principales ventajas de las tecnologías Big Data en lugar de la tradicionales de Datawarehouse es que permite tomar todos los datos para hacer los análisis. ¿Verdadero o falso?. Verdadero. Falso. ¿Cómo se llama el máximo responsable de las políticas de uso y control de los datos en una empresa?: CDO. CTO. CIO. GDPR. ¿Cómo se llama la disciplina que tradicionalmente ha creado modelos predictivos sobre los datos del Datawarehouse?: Data Exploration. Data Discovery. Data Mining. ETL. Los datos que llegan a un Data Lake suelen pasar por un proceso de validación, limpieza o normalización para poder ser explotados. ¿Verdadero o falso?. Verdadero. Falso. ¿Qué tipo de consultas suele resolver un Datawarehouse?: Operacionales. Analíticas. Un Datawarehouse está preparado para todo tipo de consultas. Consultas en streaming. Si quiero arrancar un Hadoop en la nube como servicio y quiero usar Ambari para gestionar el clúster, ¿qué solución debería utilizar?. EMR. Cloudera. HDInsight. Ninguna lleva Ambari. La principal diferencia entre Data Lake y Data Mesh es que el primero tiene un enfoque descentralizado, mientras que el segundo lo tiene descentralizado. ¿Verdadero o falso?. Verdadero. Falso. Una de las principales ventajas de las tecnologías Big Data en lugar de la tradicionales de Datawarehouse es que son más rápidas para hacer consultas. ¿Verdadero o falso?. Verdadero. Falso. El equipo de Data Governance no es responsable de la calidad de los datos, sino que es responsabilidad de equipo de ingeniería de datos. ¿Verdadero o falso?. Verdadero. Falso. El concepto de Data Lake implica que los datos no se deben transformar o modificar desde los orígenes hasta llegar a la plataforma de datos. ¿Verdadero o falso?. Verdadero. Falso. Hive es el principal componente que permite a Hadoop ser multitenancy. ¿Verdadero o falso?. Verdadero. Falso. Las tecnologías de Datawarehouse tienen un coste superior al de las tecnologías Big Data. ¿Verdadero o falso?. Verdadero. Falso. Uno de los principales beneficios de Data Lake frente a Data Mesh es permite homogeneizar más las actividades de preparación de datos. ¿Verdadero o falso?. Verdadero. Falso. El Datawarehouse tiene un modelo de almacenamiento de los datos columnar. ¿Verdadero o falso?. Verdadero. Falso. |





