option
Cuestiones
ayuda
daypo
buscar.php

BDA03 - 3

COMENTARIOS ESTADÍSTICAS RÉCORDS
REALIZAR TEST
Título del Test:
BDA03 - 3

Descripción:
Componentes de ingesta de datos y flujos de trabajo.

Fecha de Creación: 2023/04/07

Categoría: Otros

Número Preguntas: 18

Valoración:(0)
COMPARTE EL TEST
Nuevo ComentarioNuevo Comentario
Comentarios
NO HAY REGISTROS
Temario:

Sqoop proporciona una aplicación de línea de comandos para ser utilizada. Verdadero. Falso.

Las operaciones de Sqoop son básicamente dos: importar y exportar a una base de datos relacional. Verdadero. Falso.

¿Qué es Apache Sqoop?. Una herramienta para procesar datos en Hadoop. Una herramienta para transferir datos entre Hadoop y repositorios relacionales. Una herramienta para almacenar datos en HDFS.

¿Qué es un ejemplo de uso de sqoop-import?. Importar una tabla de empleados de una base de datos externa en Hive. Exportar los ficheros de Hive a una tabla de una base de datos externa. Exportar un conjunto de ficheros de HDFS a una base de datos relacional.

¿Qué es importante tener en cuenta al utilizar Sqoop?. Revisar que la base de datos vaya a soportar un número limitado de conexiones concurrentes. Revisar que la base de datos vaya a soportar un número ilimitado de conexiones concurrentes. No es necesario revisar el número de conexiones concurrentes.

¿Cuál es el objetivo principal de Apache Flume?. Recoger, agregar y mover datos generados de forma continua y atómica. Gestionar datos en bases de datos relacionales. Analizar datos de redes sociales y correo electrónico.

¿Para qué se utiliza Flume normalmente?. Para recoger y almacenar en Hadoop datos provenientes de sistemas de log, social media, IoT, emails, etc. Para procesar grandes cantidades de datos estructurados. Para generar informes estadísticos en tiempo real.

¿Qué componente de Flume almacena los datos hasta que otro agente de Flume lo consume?. Fuentes / Sources. Canal / Channel. Sumidero / Sink.

¿Qué garantiza Flume con respecto a los datos que recibe?. Garantiza la entrega de todos los datos recibidos por las fuentes. Garantiza que los datos son estructurados y consistentes. Garantiza que los datos se procesan en tiempo real.

¿Qué tipo de topologías se pueden montar en Flume?. Topologías complejas, por ejemplo, volcando los datos de una fuente en dos canales diferentes, o de un sumidero en dos destinos distintos, o anidando varias topologías de source-channel-sink > source-channel-sink. Topologías sencillas, por ejemplo, volcando los datos de una fuente en un canal y luego en un sumidero. Topologías en cascada, por ejemplo, volcando los datos de una fuente en un canal, luego en otro canal y finalmente en un sumidero.

Apache Flume: relaciona sus componentes. Fuentes / Sources. Canal / Channel. Sumidero / Sink.

¿Cuál es la función principal de Apache Oozie?. Facilitar el lanzamiento de flujos de trabajo en Hadoop. Controlar el acceso a la herramienta de informes. Descargar el maestro de clientes. Generar un tablón resumido con las ventas.

¿Qué son las condiciones de inicio en un flujo de trabajo?. Acciones que se deben realizar en un flujo de trabajo. Establecimiento de una condición temporal o existencia de datos. Un conjunto de acciones que se llevan a cabo antes de que el flujo de trabajo se ejecute. Estados de fin y error.

¿Qué son las bifurcaciones en un flujo de trabajo de Oozie?. Unión de diferentes flujos de trabajo. Mecanismos de control en los flujos de trabajo. Acciones que se realizan al final de un flujo de trabajo. Condiciones de inicio en un flujo de trabajo.

¿Qué tipos de acciones se pueden utilizar en un flujo de trabajo de Oozie?. Acciones predefinidas por Hadoop. Acciones que sólo pueden ser definidas por el usuario. MapReduce, Hive, Sqoop, DistCp, Spark, Pig, shell, Sqoop, SSH, email o acciones a medida. Acciones para el control de errores en un flujo de trabajo.

¿Qué lenguaje de definición de procesos se utiliza en Oozie?. JBOSS JBPM jPDL. hPDL (un lenguaje de definición de procesos XML). Hadoop YARN. Apache Flume.

¿Qué función cumple la parametrización en los flujos de trabajo de Oozie?. Proporcionar valores para los parámetros de los flujos de trabajo. Realizar varios trabajos de flujo de trabajo simultáneamente. Definir las bifurcaciones y decisiones del flujo de trabajo. Realizar acciones personalizadas en un flujo de trabajo.

Indica si la siguiente afirmación es verdadera o falsa. Oozie sirve para automatizar diferentes procesos que se ejecutan de forma planificada dentro de un clúster Hadoop. El ejemplo más típico son las ingestas de datos, que habitualmente se realizan en ventana nocturna, y los posteriores procesos de transformación de datos. Verdadero. Falso.

Denunciar Test