Repaso | Big Data Aplicado
![]() |
![]() |
![]() |
Título del Test:![]() Repaso | Big Data Aplicado Descripción: Cuestionario de repaso antes del examen |




Comentarios |
---|
NO HAY REGISTROS |
¿Cuál es el objetivo principal de las herramientas de almacenamiento de datos en Big Data?. Reducir el volumen de datos almacenados. Garantizar la escalabilidad y accesibilidad de los datos. Eliminar duplicados y redundancia en la información. Automatizar completamente el procesamiento de datos. ¿Cuál es una característica clave de las bases de datos NoSQL?. Siguen un esquema rígido como las bases de datos relacionales. Dependen exclusivamente del lenguaje SQL para realizar consultas. Permiten el almacenamiento flexible y escalable de datos no estructurados. Solo funcionan en entornos locales y no en la nube. ¿Cuál de las siguientes herramientas se usa para procesamiento en tiempo real en Big Data?. MySQL. Tableau. HDFS. Apache Kafka. ¿Qué ventaja principal ofrece el uso de Cloud Computing en Big Data?. El acceso a recursos de cómputo escalables bajo demanda. Eliminación de la necesidad de almacenamiento de datos. Mayor dependencia de infraestructuras locales. Procesamiento de datos sin necesidad de conexión a internet. ¿Cuál es un ejemplo de servicio de Infraestructura como Servicio (IaaS)?. Google Drive. Amazon Web Services (AWS). Microsoft Excel. Tableau. ¿Qué tipo de nube permite un uso exclusivo dentro de una organización?. Nube pública. Nube híbrida. Nube privada. Nube comunitaria. ¿Cuál es la diferencia principal entre computación paralela y distribuida?. La computación paralela usa múltiples procesadores en un solo sistema, mientras que la distribuida usa múltiples sistemas conectados en red. La computación distribuida requiere menos hardware que la paralela. Ambas son idénticas en cuanto a procesamiento de datos. La computación paralela solo se usa en entornos locales. ¿Cuál de las siguientes es una característica clave de la computación distribuida?. Los procesos se ejecutan en una sola computadora con múltiples núcleos. Requiere una red de computadoras colaborando en un mismo procesamiento. No es utilizada en entornos Big Data. No permite la escalabilidad de recursos. ¿Qué tecnología de almacenamiento distribuido es ampliamente usada en Big Data?. SQL Server. MySQL. Oracle. Hadoop HDFS. ¿Cuál es la principal característica de Hadoop?. Es un ecosistema de código abierto para el almacenamiento y procesamiento distribuido de datos. Es una base de datos relacional. Es un sistema operativo especializado en Big Data. Es una tecnología exclusiva de Google. ¿Cuál de los siguientes es un componente clave de Hadoop?. Kafka. NoSQL. HDFS. Redis. ¿Para qué se usa Map Reduce en Hadoop?. Almacenar datos en bases de datos SQL. Visualizar datos en tiempo real. Crear dashboards interactivos. Procesar grandes volúmenes de datos de manera distribuida. ¿Qué es la integridad de los datos?. Es un mecanismo de seguridad contra ataques cibernéticos. Es la capacidad de los datos para mantenerse precisos y consistentes durante su ciclo de vida. Es la cantidad de datos almacenados en una base de datos. Es la capacidad de los datos para ser accesibles en todo momento. ¿Cuál de los siguientes riesgos afecta la integridad lógica de los datos?. Ataques de denegación de servicio. Falta de espacio en servidores locales. Errores humanos y ausencia de buenas prácticas en la gestión de datos. Uso de bases de datos relacionales en entornos distribuidos. ¿Cuál es una técnica utilizada para garantizar la integridad de los datos?. Uso exclusivo de bases de datos locales. Deshabilitar accesos remotos. Almacenamiento en formatos propietarios. Uso de la suma de verificación (checksum). ¿Qué herramienta permite monitorizar servicios, datos y aplicaciones en Amazon?. Amazon CloudWatch. Apache Ambari. Dynatrace. Zabbix. ¿Qué herramienta destaca por su fácil configuración y uso amigable en monitoreo de redes?. CloudHealth. IBM Cognos. Zabbix. Argus. ¿Qué herramienta se usa para monitorizar clústeres Hadoop mediante interfaz gráfica?. Ganglia. Apache Ambari. Dynatrace. Cloudera Manager. ¿Cuál es el objetivo del Business Intelligence?. Extraer conocimiento para mejorar la toma de decisiones. Sustituir las bases de datos relacionales. Automatizar el almacenamiento de datos. Aumentar la capacidad de hardware. ¿Qué diferencia al BI del Big Data?. El BI trabaja solo con datos no estructurados. El Big Data es exclusivo de grandes empresas. El BI analiza datos históricos y el Big Data detecta patrones y tendencias. El BI no permite visualización de datos. ¿Cuál es una aplicación común del BI?. Control de acceso físico a servidores. Almacenamiento de datos geoespaciales. Gestión de redes sociales. Automatización de informes y visualización de datos. ¿Qué componente almacena datos estructurados para el BI?. Data Warehouse. OLAP. Data Lake. API REST. ¿Qué modelo de BI permite acceder a la solución sin coste pero puede acarrear costes de implantación?. BI tradicional. BI libre. BI de autoservicio. BI híbrido. ¿Cuál es una de las plataformas de BI más utilizadas que ofrece integración con Office 365?. Qlik. Power BI. Tableau. Google Data Studio. ¿Qué significa el acrónimo KDD?. Knowledge Discovery in Databases. Key Data Discovery. Knowledge Data Design. Knowledge Development Division. ¿Cuál es la etapa del modelo KDD donde se aplican algoritmos para identificar patrones?. Transformación. Preprocesamiento. Minería de datos. Interpretación. ¿Qué técnica de minería de datos se utiliza para estimar valores numéricos?. Clasificación. Regresión. Segmentación. Asociación. ¿Qué proceso transforma los datos antes de almacenarlos en un data warehouse?. ETL (Extracción, Transformación y Carga). Data mining. OLAP. KDD. ¿Qué repositorio almacena datos estructurados?. Data mart. Data lake. OLAP cube. Data warehouse. ¿Qué componente del BI permite analizar datos desde distintas dimensiones?. ETL. Data lake. OLAP. Data mart. |