option
Cuestiones
ayuda
daypo
buscar.php
TEST BORRADO, QUIZÁS LE INTERESE: BDA_5
COMENTARIOS ESTADÍSTICAS RÉCORDS
REALIZAR TEST
Título del Test:
BDA_5

Descripción:
Big Data Aplicado

Autor:
AKENATON
OTROS TESTS DEL AUTOR


Fecha de Creación:
07/04/2024

Categoría: Informática

Número Preguntas: 33
COMPARTE EL TEST
COMENTARNuevo Comentario
No hay ningún comentario sobre este test.
Temario:
¿Qué tipo de datos gestiona un Datawarehouse?: a) Datos semi-estructurados. b) Datos no estructurados. c) Cualquier tipo de datos. d) Datos estructurados.
¿Qué tipo de consultas suele resolver un Datawarehouse?: a) Consultas en streaming. b) Analíticas. c) Operacionales. d) Un Datawarehouse está preparado para todo tipo de consultas.
¿Cómo se llama el máximo responsable de las políticas de uso y control de los datos en una empresa?: a) CDO. b) CIO. c) GDPR. d) CTO.
¿Cómo se llaman las herramientas que preparan los datos para el Datawarehouse?: a) Herramientas de ETL. b) Herramientas de Data Discovery. c) El Datawarehouse no requiere una preparación previa de los datos. d) Herramientas de Data Governance.
Cómo se llaman los datos que llegan a un Data Lake y que son almacenados tal cual, sin ser transformados?: a) Raw data. b) Refined data. c) Datos de origen. d) Golden source.
¿A qué se refiere el concepto "industrialización" en relación con las actividades de ingeniería de datos?: a) A llevar todas las plataformas a la nube. b) A estandarizar y automatizar todo lo posible las tareas para ganar eficiencia. c) A aplicar tecnologías Big Data en el sector industrial. d) A aplicar mecanismos de control y validación de la calidad.
¿Cómo se llama la disciplina que tradicionalmente ha creado modelos predictivos sobre los datos del Datawarehouse?: a) Data Discovery b) Data Mining c) ETL d) Data Exploration.
¿Cuál de las siguientes afirmaciones sobre EMR no es correcta? a) EMR permite arrancar clústers Hadoop rápidamente, por lo que es muy útil para hacer pruebas con Hadoop. b) EMR permite configurar qué componentes del ecosistema Hadoop arrancar c) EMR puede adaptar el número de servidores a la carga real que esté soportando, por lo que sólo pagas por el uso real d) EMR, que son las siglas de Elastic MapReduce, sólo permite MapReduce como framework para procesar datos.
¿Qué es un sistema Datawarehouse? a) Una herramienta para analizar datos estructurados. b) Un repositorio de datos de una empresa preparado para la toma de decisiones. c) Un conjunto de herramientas para hacer análisis de Big Data.
¿Por qué los datos operacionales necesitan ser transformados antes de ser almacenados en un Datawarehouse? a) Para hacer que los datos operacionales sean más fáciles de leer. b) Para eliminar los datos operacionales que no son útiles. c) Para adaptar los datos operacionales a la estructura del Datawarehouse y aplicarles validación y limpieza.
¿Cuáles son las dos principales limitaciones de los Datawarehouses? a) No pueden manejar datos no estructurados y son costosos. b) Son lentos y no pueden manejar grandes cantidades de datos. c) No pueden manejar datos no estructurados y sólo pueden manejar datos de marketing.
¿Qué son los Datamarts? a) Subconjuntos de Datawarehouses que sólo contienen información de un departamento específico. b) Herramientas de análisis ad-hoc. c) Algoritmos de aprendizaje automático utilizados para la minería de datos.
¿Qué son las herramientas de Business Intelligence? a) Herramientas para la construcción de procesos ETL. b) Herramientas para la creación de informes, cuadros de mando o herramientas de análisis ad-hoc. c) Herramientas para la creación de modelos predictivos.
¿Cuáles son algunos de los problemas asociados con el modelo tradicional basado en herramientas de ETL, Datawarehouses y herramientas de Business Intelligence y Data Mining? a) Sólo permite analizar datos estructurados y es costoso. b) Requiere mucha intervención de los equipos de tecnología o desarrollo y sólo permite analizar datos estructurados. c) Sólo permite analizar datos estructurados y requiere mucha intervención de los equipos de tecnología o desarrollo.
¿Por qué las empresas españolas comenzaron a interesarse por las tecnologías Big Data a partir de 2014? a) Porque las empresas del sector financiero querían reducir costes en la gestión de datos. b) Porque las empresas de mayor tamaño veían beneficios en la implementación de estas tecnologías. c) Porque las empresas necesitaban adaptarse al Reglamento General de Protección de datos (GDPR).
¿Qué quiere decir la afirmación de que Hadoop es multitenancy? a) Que un clúster Hadoop tiene muchos servidores que trabajan en paralelo. b) Que Hadoop permite trabajar con muchos ficheros de cualquier tipo. c) Que Hadoop permite que múltiples usuarios de diferente tipo utilicen la plataforma.
¿Cuál de las siguientes afirmaciones no es correcta en relación con los Data Lakes? a) Hadoop es una buena plataforma para implementar un Data Lake. b) Los Data Lakes intentan ser un repositorio de datos único para toda la empresa. c) Frente a los Datawarehouses tradicionales, un Data Lake ofrece más funcionalidad. d) Un Data Lake es más fácil de gestionar que un Datawarehouse.
¿Por qué las empresas españolas comenzaron a interesarse por las tecnologías Big Data a partir de 2014? a) Porque las empresas del sector financiero querían reducir costes en la gestión de datos. b) Porque las empresas de mayor tamaño veían beneficios en la implementación de estas tecnologías. c) Porque las empresas necesitaban adaptarse al Reglamento General de Protección de datos (GDPR).
¿Qué es Hadoop como servicio? (Hadoop-as-a-Service) a) Es una plataforma para despliegue en infraestructura propia. b) Es una solución de Hadoop que se ofrece en la nube. c) Es un servicio de pago por hora para el uso de Hadoop.
¿Cuál es la principal ventaja del modelo de coste por hora y nodo en las soluciones de Hadoop como servicio? a) Permite reducir el tiempo de ejecución de tareas sin aumentar el coste. b) Reduce el coste total de ejecución de tareas. c) Permite aumentar el tamaño del clúster sin aumentar el coste.
¿Qué características tienen los servicios de Hadoop en la nube? a) Son servicios que sólo se pueden escalar en número de nodos a demanda. b) Son servicios que incluyen la mayoría de componentes del ecosistema Hadoop. c) Son servicios que sólo se integran con los servicios de los proveedores de cloud.
¿Cuáles son las principales distribuciones de Hadoop como servicio? a) EMR de Amazon Web Services y HDInsight de Microsoft Azure. b) AWS de Microsoft y Azure de Amazon. c) Hadoop de Amazon Web Services y Hadoop de Microsoft Azure.
¿Qué significa que los servicios de Hadoop en la nube sean elásticos? a) Que se pueden escalar en número de nodos a demanda. b) Que tienen un coste fijo independiente del número de nodos. c) Que sólo se pueden utilizar en horarios determinados.
¿Qué es Amazon EMR? a) Es un servicio de Amazon que permite crear clusters Hadoop a demanda b) Es un servicio de correo electrónico de Amazon c) Es una herramienta de análisis de datos de Amazon.
¿Sobre qué tipo de máquinas se ejecuta Amazon EMR? a) Sobre máquinas virtuales de Azure b) Sobre máquinas EC2 de Amazon c) Sobre máquinas físicas de Google Cloud Platform.
¿Qué tipos de clústeres se pueden arrancar en Amazon EMR? a) Core Hadoop, HBase, Presto y Spark b) HBase, MySQL, Presto y Spark c) Core Hadoop, HBase, MongoDB y Spark.
¿Qué es la política de autoescalado en Amazon EMR? a) Es la posibilidad de añadir automáticamente más nodos al clúster en caso de que la carga de los mismos supere un umbral b) Es la posibilidad de ejecutar diferentes tipos de clústeres en EMR c) Es la posibilidad de seleccionar qué componentes del ecosistema se quiere instalar y arrancar en el clúster que vamos a crear.
¿Qué es HDInsight y en qué consiste? a) Es una solución de Hadoop como servicio que permite arrancar clústers Hadoop a demanda en una modalidad de pago por uso. b) Es una solución de Azure que proporciona herramientas de administración y monitorización para clústers de Hadoop. c) Es una distribución de Hadoop propia de Microsoft Azure.
¿Qué herramienta de administración y monitorización proporciona HDInsight? a) Ambari. b) Ganglia c) Una herramienta propia de Azure.
¿Qué se requiere para poder utilizar el servicio HDInsight? a) Tener una cuenta en Microsoft Azure. b) Tener una cuenta en Amazon EMR. c) Tener una distribución propia de Hadoop.
¿Cómo se define el tipo de clúster en HDInsight? a) A través de un formulario donde se indica el tipo de componentes del ecosistema Hadoop que utilizan. b) A través de un formulario donde se indica el tipo de almacenamiento a utilizar. c) A través de un formulario donde se indica el número de nodos que se quieren utilizar.
¿Cuánto tiempo dura el proceso de arranque de un clúster en HDInsight? a) Alrededor de 5 minutos. b) Alrededor de 10 minutos. c) Alrededor de 15 minutos.
¿Cuál de las siguientes afirmaciones no es correcta en relación con los Data Lakes? a) Hadoop es una buena plataforma para implementar un Data Lake. b) Los Data Lakes intentan ser un repositorio de datos único para toda la empresa. c) Frente a los Datawarehouses tradicionales, un Data Lake ofrece más funcionalidad. d) Un Data Lake es más fácil de gestionar que un Datawarehouse.
Denunciar Test