Big Data Aplicado #2
|
|
Título del Test:
![]() Big Data Aplicado #2 Descripción: Test número 4 |



| Comentarios |
|---|
NO HAY REGISTROS |
|
¿Qué significa HDFS?. Hadoop Direct File Server. High Distributed File Storage. Hadoop Data File System. Hadoop Distributed File System. ¿Cuáles son las dos fases principales del paradigma MapReduce?. Map y Reduce. Divide y Conquista. Process y Store. Split y Join. ¿Qué tipo de arquitectura utiliza HDFS?. Arquitectura de tres capas. Arquitectura maestro-esclavo. Arquitectura peer-to-peer. Arquitectura cliente-servidor simple. ¿Qué es la Integridad de Datos?. La capacidad de cifrar datos. La ausencia de cambios involuntarios en la información entre dos actualizaciones sucesivas. El tamaño total de los datos almacenados. La velocidad de procesamiento de datos. ¿Qué puerto se utiliza normalmente para acceder a la Web UI del NameNode?. 3306. 27017. 8080. 9870. En visualización de datos, ¿qué inventor creó el gráfico de barras y circular?. John Tukey. Charles Minard. William Playfair. Florence Nightingale. ¿Cuál es el formato de compresión que HBase utiliza por defecto?. GZIP. LZ4. SNAPPY. LZO. ¿Cuál de las siguientes NO es una característica de los sistemas distribuidos?. Rendimiento. Escalabilidad. Centralización. Disponibilidad. ¿Cuál es la diferencia entre Replicación y Duplicación de datos?. Duplicación usa más espacio que Replicación. Replicación es más lenta que Duplicación. Son lo mismo. Replicación = creación de múltiples copias distribuyendo la carga de trabajo; Duplicación = crear una copia exacta como medida de respaldo. ¿Cuál de los siguientes es un tipo de CRC?. CRC-32, CRC-16, CRC-CCITT. CRC-8, CRC-128, CRC-256. CRC-MD5, CRC-SHA, CRC-RSA. CRC-A, CRC-B, CRC-C. ¿Qué es RDD en Apache Spark?. Remote Database Driver. Rapid Data Distribution. Resilient Distributed Dataset. Real-time Data Delivery. ¿Qué miden los Mapas de Calor?. Únicamente datos geográficos. Exclusivamente datos temporales. La magnitud de un fenómeno a través de colores en un plano con dos dimensiones. Solo temperaturas. ¿Cuáles son las funcionalidades principales de Apache Sqoop?. Solo exportación de datos. Solo importación de datos. Compresión y encriptación. Importación (RDBMS → HDFS/Hive/HBase) y Exportación (HDFS/Hive) → RDBMS. Identifica cuáles de las siguientes operaciones de Spark son TRANSFORMACIONES: Todas son acciones. Filter(), Distinct(), Union(), Join(). Count(), Show(), Top(), CountByValue(). Select(), WithColumn(), Show(), Top(). ¿Cuáles son los tres retos principales en la Replicación de Datos?. Consistencia, Retrasos en la replicación y actualización de cambios, Latencia en la conexión. Seguridad, Privacidad, Cumplimiento. Velocidad, Almacenamiento, Costo. Hardware, Software, Personal. ¿Cuál es la diferencia clave entre Arquitectura Centralizada y Descentralizada en Sistemas de Archivos Distribuidos?. No hay diferencia práctica. La Centralizada se basa en un único servidor maestro que administra metadatos; la Descentralizada elimina el servidor maestro y distribuye metadatos entre varios servidores. La Centralizada es más rápida. La Descentralizada solo funciona con HDFS. ¿Qué garantías ACID proporciona HBase a nivel de fila?. Solo Durabilidad. Ninguna garantía ACID. Atomicidad, Consistencia, Aislamiento, Durabilidad mediante WAL. Solo Atomicidad y Consistencia. ¿Cuáles son las tres fases del proceso MapReduce?. Read, Transform, Write. Collect, Analyze, Store. Input, Process, Output. 1. Map (cada persona cuenta palabras en un libro), 2. Shuffle & Sort (agrupamos palabras iguales), 3. Reduce (sumamos conteos). ¿Cuáles son los cuatro beneficios clave de los Sistemas Distribuidos y sus descripciones correctas?. 1. Escalabilidad (Agregar Nodos según necesidad), 2. Economía (Hardware Commodity), 3. Disponibilidad (Eliminar punto único de fallo), 4. Rendimiento (Distribución de carga). Capacidad, Redundancia, Flexibilidad, Control. Velocidad, Seguridad, Economía, Simplicidad. Rapidez, Confiabilidad, Accesibilidad, Eficiencia. ¿Cuál es la relación correcta entre latencia de procesamiento y las herramientas?. Todas tienen la misma latencia. MapReduce: minutos; Spark: milisegundos; Flink: segundos. MapReduce: segundos a minutos; Spark: 100ms a segundos; Flink: milisegundos. MapReduce: milisegundos; Spark: segundos; Flink: minutos. |





