Cuestionario: Introducción a Apache Hadoop
|
|
Título del Test:
![]() Cuestionario: Introducción a Apache Hadoop Descripción: Hadoop examen |



| Comentarios |
|---|
NO HAY REGISTROS |
|
¿En qué año se originó Hadoop?. 2003. 2004. 2006. ¿Cuál es el nombre del sistema de ficheros de Hadoop?. HDFS. YARN. MapReduce. ¿Cuál es la capa de procesamiento de Hadoop?. HDFS. YARN. MapReduce. ¿Qué permite hacer Apache Hive?. Ingestar streams de datos. Acceder a datos como si fueran una base de datos relacional. Definir flujos de trabajo en Hadoop. ¿Qué componente de Hadoop se utiliza para la ingesta de streams de datos?. Apache Hive. Apache Flume. Apache Sqoop. ¿Qué es Hadoop?. Una base de datos. Una plataforma. Una herramienta de visualización. ¿Qué tipo de escalado utiliza Hadoop?. Escalado vertical. Escalado horizontal. Ninguno de los anteriores. ¿Qué significa que Hadoop es tolerante a fallos?. Que puede funcionar sin necesidad de internet. Que ante la caída de uno de los servidores, el sistema sigue funcionando y no se pierden datos. Que es resistente al agua. ¿Qué tipo de hardware utiliza Hadoop?. Hardware específico. Hardware commodity. Hardware de gama alta. ¿Cuál es la principal diferencia entre Hadoop y los sistemas tradicionales de procesamiento de datos?. El costo. La velocidad. La seguridad. ¿Qué son HDFS y YARN?. Componentes principales de Hadoop. Herramientas de visualización. Lenguajes de programación. ¿Qué es Apache Spark?. Un sistema de mensajería. Un motor de procesamiento masivo de datos. Una base de datos NoSQL. ¿Qué son las distribuciones comerciales de Hadoop?. Versiones gratuitas de Hadoop. Paquetes que incluyen la mayor parte de componentes del ecosistema, resuelven dependencias y ofrecen soporte. Herramientas de visualización de datos. ¿Cuál es una ventaja de las soluciones Hadoop-as-a-Service?. Mayor control sobre la infraestructura. Elasticidad y pago por uso. Mayor personalización. ¿Cuál es el tipo de nodos que controlan la ejecución de los trabajos en Hadoop?. Nodos worker. Nodos master. Nodos edge. ¿Cómo se consigue la tolerancia a fallos en el almacenamiento de Hadoop?. Duplicando los datos. Usando un único nodo. Cifrando los datos. ¿Qué tipo de hardware suele usarse en los nodos worker?. Hardware específico de alto rendimiento. Hardware commodity. Hardware de gama baja. ¿Qué tipo de nodos hacen de puente entre el clúster y la red exterior?. Nodos worker. Nodos master. Nodos edge. ¿Qué significa schema-on-read?. Definir la estructura de los datos antes de almacenarlos. No definir la estructura de los datos antes de almacenarlos. Leer los datos en un formato específico. ¿Qué es un nodo en Hadoop?. Un conjunto de servidores. Un servidor. Un componente de software. ¿Qué es un clúster en Hadoop?. Un servidor individual. Un conjunto de nodos. Un tipo de dato. ¿Qué desventaja tiene Hadoop?. Requiere nuevos perfiles escasos. Es muy económico. Es fácil de integrar. ¿Cuándo NO es recomendable usar Hadoop?. Cuando el volumen de datos es muy grande. Cuando se requiere una alta transaccionalidad. Cuando hay variedad de datos. ¿Qué es Apache Hive?. Un sistema de mensajería. Una base de datos NoSQL. Una herramienta para consultas SQL sobre datos en HDFS. ¿Qué es Apache Sqoop?. Una herramienta para importar y exportar datos entre Hadoop y bases de datos relacionales. Un sistema de procesamiento en tiempo real. Una base de datos NoSQL. ¿Cuál es la función principal de los nodos master?. Almacenar los datos. Controlar la ejecución de los trabajos y gestionar el almacenamiento. Procesar los datos. ¿Qué es Apache Flume?. Un sistema de almacenamiento distribuido. Una herramienta para la ingesta de datos en tiempo real. Un motor de búsqueda. ¿Qué caracteriza al hardware commodity?. Hardware de gama alta. Hardware no específico con requerimientos exigentes. Hardware de bajo coste. ¿Qué tipo de datos puede procesar Hadoop?. Sólo datos estructurados. Sólo datos no estructurados. Datos estructurados, semiestructurados y no estructurados. ¿Qué es YARN?. Un sistema de ficheros. Un gestor de recursos. Un lenguaje de programación. ¿En qué se basa el enfoque de Hadoop?. En el almacenamiento centralizado de datos. En el procesamiento distribuido de datos. En la utilización de hardware específico. ¿Qué característica de Hadoop permite la escalabilidad 'ilimitada'?. El uso de hardware específico. El enfoque distribuido y la adición de nodos. La alta transaccionalidad. ¿Qué es una distribución comercial de Hadoop?. Una versión gratuita de Hadoop. Un paquete que simplifica la instalación y el soporte de Hadoop. Una herramienta para visualizar datos. ¿Cuál es un beneficio principal de usar Hadoop?. Alta transaccionalidad. Bajo costo para grandes volúmenes de datos. Facilidad para procesar datos estructurados. ¿Cuál es el componente de Hadoop encargado del sistema de ficheros?. YARN. HDFS. MapReduce. ¿Cuál es una de las principales desventajas de Hadoop?. Escalabilidad lineal. Bajo costo. Complejidad en su administración. ¿Qué tipo de problema resuelve principalmente Hadoop?. Problemas de transaccionalidad. Problemas de baja volumetría de datos. Problemas de procesamiento de grandes volúmenes de datos. ¿Qué caracteriza el almacenamiento en un nodo worker?. Replicación de datos. Hardware específico. JBOD (Just a Bunch of Disks). ¿Qué es Apache Atlas?. Un sistema de mensajería. Una herramienta de gobierno de datos. Una base de datos NoSQL. ¿Qué es Apache Kafka?. Un motor de búsqueda. Un sistema de mensajería para eventos en tiempo real. Una base de datos columnar. ¿Cuál es la función de Apache Oozie?. Gestionar flujos de trabajo en Hadoop. Consultar datos con SQL. Almacenar datos. ¿Cuál es la principal ventaja de usar Hadoop en comparación con sistemas tradicionales?. Mayor velocidad de procesamiento para datos pequeños. Menor costo para grandes volúmenes de datos. Mayor facilidad de administración. ¿En qué tipo de escenario es más adecuado Hadoop?. Escenarios con alta transaccionalidad y datos estructurados. Escenarios con datos variados, gran volumen y escalabilidad. Escenarios con datos pequeños y requerimientos de baja latencia. ¿Qué componente de Hadoop permite el acceso a datos en HBase mediante una interfaz SQL?. Apache Hive. Apache Phoenix. Apache Impala. ¿Qué se necesita para instalar Hadoop?. Un solo servidor. Un clúster de servidores. Una base de datos relacional. ¿Qué es la replicación de datos en Hadoop?. La creación de una copia de los datos en varios nodos. La compresión de los datos. La eliminación de datos duplicados. ¿Cuál es la función de Apache Zeppelin?. Almacenar datos. Crear notebooks para análisis de datos. Gestionar colas de mensajes. ¿Qué es Apache Accumulo?. Una base de datos NoSQL. Un sistema de mensajería. Un motor de búsqueda. ¿Qué es Apache Mahout?. Un sistema de ficheros. Un conjunto de librerías para machine learning. Un sistema de gestión de flujos de trabajo. |





