Sistemas de Big Data #2
|
|
Título del Test:
![]() Sistemas de Big Data #2 Descripción: Test número 2 |



| Comentarios |
|---|
NO HAY REGISTROS |
|
¿Qué significa ETL en el contexto de Big Data?. Export, Translate, Load. Extract, Transform, Load. Evaluate, Test, Launch. Execute, Transfer, Link. ¿Cuál de los siguientes es un tipo de base de datos NoSQL?. Jerárquicas tradicionales. Relacionales (ej. MySQL). Documentales (ej. MongoDB). Secuenciales. ¿Qué significa DDL en SQL?. Data Display Language. Database Design Language. Data Definition Language. Data Description Language. ¿Cuál de las siguientes es una herramienta de visualización de datos?. Tableau. Redis. MongoDB. Apache Kafka. ¿En qué año se creó Apache Spark?. 2000. 2025. 2006. 2010. ¿Cuál es la primera fase de la metodología CRISP-DM?. Entendimiento del Negocio. Modelado. Preparación de Datos. Evaluación. ¿Qué biblioteca de Python se utiliza para trabajar con DataFrames y Series?. Matplotlib. NumPy. Pandas. TensorFlow. ¿Cuál de estas herramientas es utilizada para Web Scraping en Python?. Pandas. BeautifulSoup. Keras. NumPy. ¿Qué tipo de sentencias SQL incluye INSERT, SELECT, UPDATE y DELETE?. DML (Data Manipulation Language). DDL (Data Definition Language). DCL (Data Control Language). DQL (Data Query Language). ¿Cuál es una de las 5 V's de Big Data que se refiere a garantizar la calidad y precisión de los datos?. Velocidad. Variedad. Volumen. Veracidad. ¿Cuántos quintillones de bytes de datos se generan diariamente según la documentación?. 10 quintillones. 1 quintillones. 5 quintillones. 2.5 quintillones. ¿Qué componente de Apache Spark proporciona un motor de ejecución general subyacente?. Spark MLlib. Spark Streaming. Spark SQL. Spark Core. ¿Cuál de las siguientes es una dimensión de calidad de datos?. Compatibilidad. Completitud. Complejidad. Compilación. ¿Qué significa RDD en Apache Spark?. Reliable Data Delivery. Resilient Distributed Dataset. Real-time Database Design. Rapid Data Distribution. ¿Qué herramienta utiliza Netflix para Service Discovery en su arquitectura de microservicios?. Flink. Eureka. Hadoop. Kafka. ¿En qué fase del proceso MapReduce se filtra, parsea o transforma la información?. Función reduce. Fase de redistribución. Fase shuffle. Función map. ¿Cuál es el nombre del tablón en CRISP-DM?. Tabla de resultados finales. Dataset de entrenamiento inicial. Conjunto final de datos que se utilizará en la construcción del modelo. Base de datos principal del proyecto. ¿Qué tipo de transformación en Spark utiliza funciones como groupByKey() o reduceByKey()?. Narrow transformation. Wide transformation. Simple transformation. Basic transformation. ¿Qué framework de validación de calidad de datos mide específicamente precisión, completitud y consistencia según Apache?. Apache Kafka. Great Expectations. Deequ. Apache Griffin. ¿Qué es un DAG (Directed Acyclic Graph) en el contexto de Apache Spark?. Una estructura de datos acíclica para almacenamiento. Un grafo de dependencias automáticas generado. Un diagrama de algoritmos generales para procesamiento distribuido. Un grafo dirigido que no tiene ciclos, donde cada nodo no tiene un camino directo que comience y finalice en dicho nodo. |





