option
Cuestiones
ayuda
daypo
buscar.php

BDA

COMENTARIOS ESTADÍSTICAS RÉCORDS
REALIZAR TEST
Título del Test:
BDA

Descripción:
BIG DATA APLICADO

Fecha de Creación: 2024/06/03

Categoría: Otros

Número Preguntas: 93

Valoración:(2)
COMPARTE EL TEST
Nuevo ComentarioNuevo Comentario
Comentarios
NO HAY REGISTROS
Temario:

Hadoop requiere hardware commodity, lo que significa que puedo montarme un clúster en casa con los PCs obsoletos que tengo. ¿Verdadero o falso?. Verdadero. Falso.

El coste de Hadoop es similar al de las bases de datos relacionales, la diferencia está en que Hadoop es escalable. ¿Verdadero o falso?. Verdadero. Falso.

Hadoop es un proyecto liderado por la empresa Cloudera. ¿Verdadero o falso?. Verdadero. Falso.

Los nodos frontera realizan parte del trabajo de procesamiento con los datos en una plataforma Hadoop. ¿Verdadero o falso?. Verdadero. Falso.

Hadoop es la única tecnología capaz de almacenar y procesar grandes volúmenes de datos hasta un volumen de petabytes. ¿Verdadero o falso?. Verdadero. Falso.

Hadoop es una tecnología fácil de instalar y administrar. ¿Verdadero o falso?. Verdadero. Falso.

Sqoop es el componente que se utiliza para ingestar datos de sensores en Hadoop. ¿Verdadero o falso?. Verdadero. Falso.

Hadoop, como es una solución bastante moderna, no tiene una herramienta de gobierno de datos. ¿Verdadero o falso?. Verdadero. Falso.

YARN se ofreció en Hadoop desde su origen. Verdadero. Falso.

YARN divide la capacidad de procesamiento y memoria en contenedores. Verdadero. Falso.

En HDFS, sólo los ficheros grandes se dividen en bloques. Verdadero. Falso.

YARN ha caído en desuso al aparecer Spark. Verdadero. Falso.

MapReduce se usa cada día más, especialmente tras la aparición de Spark. Verdadero. Falso.

Hive es escalable porque pueden añadirse más nodos HiveServer2 para que trabajen en paralelo, ejecutando una query en los diferentes HiveServer2. ¿Verdadero o falso?. Verdadero. Falso.

Apache Spark es una tecnología que sustituye a Hadoop. ¿Verdadero o falso?. Verdadero. Falso.

HBase ofrece un interfaz de consultas parecido a SQL, llamado HQL. ¿Verdadero o falso?. Verdadero. Falso.

Hive es una herramienta muy útil, pero tiene como aspecto negativo es que toda la seguridad la delega en los permisos de los ficheros de HDFS. ¿Verdadero o falso?. Verdadero. Falso.

Apache Flink es una buena herramienta de procesamiento en tiempo real, pero tiene como principal inconveniente que no se puede ejecutar sobre YARN. ¿Verdadero o falso?. Verdadero. Falso.

Utilizando el comando top se puede ver el consumo de memoria de los diferentes procesos en el sistema operativo. ¿Verdadero o falso?. Verdadero. Falso.

En Ambari se puede realizar la ingesta de unos ficheros como administrador, para que luego los usuarios del clúster puedan utilizarlos. ¿Verdadero o falso?. Verdadero. Falso.

El servicio ResourceManager UI es sencillo, pero permite monitorizar y modificar parámetros de configuración de YARN. ¿Verdadero o falso?. Verdadero. Falso.

Ganglia es una herramienta de Apache y del ecosistema Hadoop específica para monitorizar clústers de servidores. ¿Verdadero o falso?. Verdadero. Falso.

El servicio Namenode UI es sencillo, pero permite monitorizar y modificar parámetros de configuración de HDFS. ¿Verdadero o falso?. Verdadero. Falso.

Utilizando el comando vmstat se puede ver el consumo de CPU de los diferentes procesos en el sistema operativo. ¿Verdadero o falso?. Verdadero. Falso.

Ganglia permite parar los servidores del clúster, pero no permite parar servicios concretos de Hadoop, como HDFS o Hive. ¿Verdadero o falso?. Verdadero. Falso.

Hive es el principal componente que permite a Hadoop ser multitenancy. ¿Verdadero o falso?. Verdadero. Falso.

Un Data Lake no ofrece herramientas de explotación de los datos, esta responsabilidad recae en los usuarios. ¿Verdadero o falso?. Verdadero. Falso.

La principal diferencia entre Data Lake y Data Mesh es que el primero tiene un enfoque descentralizado, mientras que el segundo lo tiene centralizado. ¿Verdadero o falso?. Verdadero. Falso.

El equipo de Data Governance no es responsable de la calidad de los datos, sino que es responsabilidad de equipo de ingeniería de datos. ¿Verdadero o falso?. Verdadero. Falso.

Una de las primeras tareas que hay que realizar para implantar un clúster Hadoop es diseñar los procesos ETL. ¿Verdadero o falso?. Verdadero. Falso.

Las soluciones de Hadoop como servicio son todavía poco maduras. ¿Verdadero o falso?. Verdadero. Falso.

Una de las principales ventajas de las tecnologías Big Data en lugar de las tradicionales en Datawarehouse es que son más rápidas para hacer consultas. ¿Verdadero o falso?. Verdadero. Falso.

Una vez instalado un Hadoop on-premise, es necesario hacer optimizarlo o tunearlo para obtener el máximo rendimiento. Verdadero. Falso.

Uno de los principales problemas de Data Lake frente a data Mesh es que es más difícil de escalar. Verdadero. Falso.

Data Mesh es un concepto que ha aparecido después que el concepto de Data Lake. Verdadero. Falso.

En un entorno multitenancy es importante definir una estructura de directorios clara. Verdadero. Falso.

El concepto de Data Lake implica que los datos no se deben transformar o modificar desde los orígenes hasta llegar a la plataforma de datos. Verdadero. Falso.

Una de las principales ventajas de las tecnologías Big Data en lugar de la tradicionales de Datawarehouse es que permite tomar todos los datos para hacer los análisis. Verdadero. Falso.

Uno de los beneficios de los Data Lakes frente a los Datawarehouses es que permiten procesar cualquier tipo de dato, no sólo datos estructurados. Verdadero. Falso.

Un plan de capacidad requiere conocer qué necesidades de datos tendrá una plataforma. Verdadero. Falso.

¿Data Governance es el conjunto de procesos, roles, políticas, estándares y métricas que garantizan el uso eficiente y efectivo de los datos, alineado con los objetivos de las empresas.?. Verdadero. Falso.

¿Las tecnologías de Datawarehouse tienen un coste superior al de las tecnologías Big Data.?. Verdadero. Falso.

¿Uno de los principales beneficios de Data Lake frente a Data Mesh es permite homogeneizar más las actividades de preparación de datos?. Verdadero. Falso.

¿Las tecnologías Big Data se empezaron a probar porque los equipos de tecnología vieron la capacidad de resolver casos de uso para el negocio?. Verdadero. Falso.

¿Cómo se llaman los datos que llegan a un Data Lake y que son almacenados tal cual, sin ser transformados?. Raw data. Data Mining.

¿Cómo se llama la disciplina que tradicionalmente ha creado modelos predictivos sobre los datos del Datawarehouse?. Raw data. Data Mining.

El Datawarehouse tiene un modelo de almacenamiento de los datos columnar.?. Verdadero. Falso.

¿El servicio Namenode UI permite navegar por el sistema de ficheros de HDFS.?. Verdadero. Falso.

¿Tiene Cloudera Manager tiene más o menos la misma funcionalidad que Ambari?. Verdadero. Falso.

¿Tiene Ambari permite iniciar una instalación de Hadoop en un conjunto de servidores.?. Verdadero. Falso.

¿En Ambari puedo tener cuadros de mando a medida para monitorizar las métricas de salud que más me interesen?. Verdadero. Falso.

¿Utilizando el comando dstat se puede ver el consumo de red de los diferentes procesos en el sistema operativo.?. Verdadero. Falso.

¿El servicio Namenode UI permite ver cuánto espacio está ocupando HDFS?. Verdadero. Falso.

Para monitorizar un clúster Hadoop, en primer lugar hay que ver las métricas relacionadas con el sistema operativo: CPU, memoria, disco y red. Verdadero. Falso.

Desde Cloudera Manager podría simular la caída de un servidor para hacer pruebas de tolerancia a fallos¿Verdadero o falso?. Verdadero. Falso.

Cloudera Manager salió al mercado varios años antes que Ambari. ¿Verdadero o falso?. Verdadero. Falso.

Si no existiera Ambari o Cloudera Manager, habría que modificar la configuración de todos los ficheros de configuración a mano, por ejemplo, con el comando vi ¿Verdadero o falso?. Verdadero. Falso.

El servicio ResourceManager UI permite ver los logs de ejecución de las aplicaciones ¿Verdadero o falso?. Verdadero. Falso.

Apache Ambari se puede utilizar para instalar un clúster Hadoop, facilitando mucho esta labor. ¿Verdadero o falso?. Verdadero. Falso.

Apache Spark ofrece la capacidad de procesar datos en streaming ¿Verdadero o falso?. Verdadero. Falso.

¿Qué componente del ecosistema Hadoop permite utilizar sintaxis SQL para manejar datos que están almacenado en HBase?. Phoenix. Flume. Zeppelin. Oozie. Pig.

De las siguientes herramientas, ¿cuál será la principal de trabajo de los data scientists para visualizar y explorar los datos de HDFS?. Phoenix. Flume. Zeppelin. Oozie. Pig.

¿Desde qué componente de Hadoop se puede enviar un email al administrador cuando una ingesta automática ha fallado?. Phoenix. Flume. Zeppelin. Oozie. Pig.

Para ingestar datos que se generan en tiempo real, ¿qué componente de Hadoop se utiliza?. Phoenix. Flume. Zeppelin. Oozie. Pig.

¿Qué componente del ecosistema Hadoop fue el primero en aparecer para reducir la complejidad de los procesos MapReduce que se desarrollaban hasta entonces?. Phoenix. Flume. Zeppelin. Oozie. Pig.

Si quiero parar un nodo de un clúster Hadoop porque está dando problemas, ¿qué herramienta podré utilizar?. Ambari.. Hue.. Hive. Spark, Hive, Kafka. EMR.

Hive permite conectar Excel con ficheros que están en HDFS.? ¿Verdadero o falso?. Verdadero.. Falso.

Para automatizar la ejecución de trabajos que se debe realizar en Hadoop, por ejemplo, para validar los datos ingestados, ¿qué componente se debe utilizar?. Phoenix. Flume. Zeppelin. Oozie. Pig.

Apache Spark puede leer y procesar datos que se encuentran en una base de datos relacional.¿Verdadero o falso?. Verdadero.. Falso.

Una partición de una tabla es un subconjunto de los registros de la tabla que comparten el valor de alguna columna en común..¿Verdadero o falso?. Verdadero.. Falso.

Apache Spark tiene una latencia mayor que Apache Flink como norma general para procesamiento en tiempo real¿Verdadero o falso?. Verdadero.. Falso.

Si tengo un HDFS con 10 datanodes, y cada datanode tiene una capacidad de 10 terabytes. ¿Cuál será la capacidad real, si no modifico ningún parámetro de HDFS?. Unos 20 terabytes. 10-20 Gbps. 128mb. 256 Gb.

HDFS tiene una orientación "write-once, read many", que significa "se escribe una vez, se lee muchas veces".¿Verdadero o falso?. Verdadero.. Falso.

YARN puede ejecutar aplicaciones de procesamiento en streaming ¿Verdadero o falso?. Verdadero.. Falso.

Si un nodo falla durante la ejecución de una tarea, YARN se da cuenta y rearranca esa tarea en otro nodo. ¿Verdadero o falso?. Verdadero.. Falso.

YARN divide la capacidad de procesamiento y memoria en contenedores. ¿Verdadero o falso?. Verdadero.. Falso.

En HDFS, lo ideal es poner un factor de replicación alto a los ficheros que son críticos o muy importantes. ¿Verdadero o falso?. Verdadero.. Falso.

HDFS está optimizado para ficheros de gran tamaño. ¿Verdadero o falso?. Verdadero.. Falso.

Se suele considerar a Doug Cutting como el "padre de Hadoop". ¿Verdadero o falso?. Verdadero.. Falso.

¿Cuál es el componente que se utiliza para planificar, orquestar o automatizar flujos de trabajo en Hadoop?. Phoenix. Flume. Zeppelin. Oozie. Pig.

Hadoop cubre bien los casos de uso donde se quiere analizar datos con algoritmos de Machine Learning.¿Verdadero o falso?. Verdadero.. Falso.

Hadoop no es un sistema eficiente para casos de uso de poca volumetría.¿Verdadero o falso?. Verdadero.. Falso.

La arquitectura de Hadoop se basa en tener nodos worker, que hacen el trabajo, y nodos master que coordinan ese trabajo.¿Verdadero o falso?. Verdadero.. Falso.

Storm permite procesar datos que llegan en streaming.¿Verdadero o falso?. Verdadero.. Falso.

¿Cómo se llama la solución Hadoop que ofrece Amazon Web Services?. Ambari.. Hue.. Hive. Spark, Hive, Kafka. EMR.

¿Cuáles son las herramientas del ecosistema Hadoop más utilizadas?. Ambari.. Hue.. Hive. Spark, Hive, Kafka. EMR.

¿Qué componente del ecosistema Hadoop permite acceder a los ficheros de HDFS con lenguaje SQL, como si fueran tablas de una base de datos?. Ambari.. Hue.. Hive. Spark, Hive, Kafka. EMR.

¿Qué cantidad de memoria es recomendada para la instalación de Hadoop?. Unos 20 terabytes. 10-20 Gbps. 128mb. 256 Gb.

Sobre el tipo de red en el que conectar Hadoop, ¿qué afirmación es correcta?. Unos 20 terabytes. 10-20 Gbps. 128mb. 256 Gb.

¿Cuál es el tamaño por defecto de un bloque en HDFS?. Unos 20 terabytes. 10-20 Gbps. 128mb. 256 Gb.

¿Cuál de las siguientes distribuciones Hadoop se encuentra activa hoy en día?. GFS. Zeppelin. Cloudera. EMR.

¿Cómo se llama el sistema de almacenamiento de Hadoop?. GFS. Zeppelin. Cloudera. EMR.

¿Cuál es la herramienta o componente del ecosistema Hadoop con la que los Data Scientists realizan análisis interactivos?. GFS. Zeppelin. Cloudera. EMR.

Denunciar Test