BDA02

COMENTARIOS

ESTADÍSTICAS

RÉCORDS

REALIZAR TEST

Título del Test:

BDA02

Descripción:
BDA tema 02

Autor:

apuntesce

OTROS TESTS DEL AUTOR

Fecha de Creación: 2023/03/28

Categoría: Otros

Número Preguntas: 95

Valoración:

(3)

COMPARTE EL TEST

Nuevo Comentario

Comentarios
NO HAY REGISTROS

Temario:

En HDFS, sólo los ficheros grandes se dividen en bloques. Verdadero. Falso.

¿Cómo se llama el nodo que coordina la ejecución de trabajos en YARN?. Scheduler. NodeManager. NameNode. ResourceManager.

MapReduce permite que los desarrolladores no tengan que preocuparse en muchos aspectos de la computación distribuida. Verdadero. Falso.

Si en HDFS un fichero indica que tiene permisos rwxrwxrwx, ¿quién puede modificar el fichero?: Todos los usuarios. En HDFS no se pueden modificar los ficheros. Todos los usuarios menos el que creó el fichero. El usuario que lo creó.

YARN divide la capacidad de procesamiento y memoria en contenedores. Verdadero. Falso.

YARN ha caído en desuso al aparecer Spark. Verdadero. Falso.

¿Cuál es el comando de HDFS para llevar un fichero desde el disco del nodo frontera hasta HDFS?. put. cp. mv. mv external.

¿Cuál es el comando de HDFS para crear un directorio?. rmdir. create dir. mkdir. make_dir.

¿Cuál es el tamaño por defecto de un bloque en HDFS?: 128 GB. 128 MB. 64 GB. 64 MB.

¿Cuál es el comando de HDFS para modificar el factor de replicación de un fichero?: mod rf. setrep. mod. chmod.

HDFS tiene una orientación "write-once, read many", que significa "se escribe una vez, se lee muchas veces". Verdadero. Falso.

En HDFS, el Namenode se encarga de dar los ficheros a las aplicaciones que quieren leerlos. Verdadero. Falso.

YARN puede ejecutar aplicaciones de procesamiento en streaming. Verdadero. Falso.

¿Cuál es el comando de HDFS para ver el contenido de un fichero?. read. cat. ls. open.

¿Qué métodos se suelen desarrollar para hacer un programa MapReduce?. Map, Reduce y Shuffle. Map, Reduce y Order. Map y Reduce. Ninguno, MapReduce se encarga de todo.

HDFS funciona mejor con ficheros binarios. Verdadero. Falso.

HDFS está optimizado para ficheros de gran tamaño. Verdadero. Falso.

En HDFS, lo ideal es poner un factor de replicación alto a los ficheros que son críticos o muy importantes. Verdadero. Falso.

El factor de replicación reduce la capacidad de almacenamiento real de un clúster HDFS. Verdadero. Falso.

Hadoop requiere hardware commodity, lo que significa que puedo montarme un clúster en casa con los PCs obsoletos que tengo. Verdadero. Falso.

El tamaño de un bloque en HDFS no puede modificarse, es 128 megabytes para todos los clústers. Verdadero. Falso.

Es bueno tener siempre un factor de replicación alto para no perder datos. Verdadero. Falso.

HDFS tiene una estructura de directorios, subdirectorios y ficheros. Verdadero. Falso.

¿Cuál se los siguientes servicios se ejecutan en más de un nodo en HDFS?. Namenode. Secondary Namenode. Datanode.

En HDFS, los clientes del sistema de ficheros tienen que tener conectividad con todos los Datanodes. Verdadero. Falso.

El comando ls permite ver el contenido de un directorio. Verdadero. Falso.

El comando cp permite copiar un fichero de una máquina y llevarlo a HDFS. Verdadero. Falso.

Si quiero ver el contenido de un fichero, puedo usar el comando ls. Verdadero. Falso.

¿Cuál de los siguientes servicios de YARN es crítico, de manera que representa un punto único de fallo y que sin él, no se podrían ejecutar aplicaciones?. Namenode. ApplicationMaster. ResourceManager. NodeManager.

Los clientes de YARN, que pueden ser aplicaciones externas o usuarios que quieren lanzar una aplicación a mano, necesitan tener acceso a los nodos worker para que la tarea se ejecute. Verdadero. Falso.

MapReduce requiere en primer lugar una etapa de diseño para idear cómo se debe resolver el problema utilizando operaciones map y reduce. Verdadero. Falso.

En MapReduce, los datos de entrada se separan en fragmentos y cada fragmento es procesado en paralelo. Verdadero. Falso.

Hay problemas que no pueden resolverse con MapReduce. Verdadero. Falso.

¿Qué métodos será necesario implementar para hacer un trabajo MapReduce que se pueda ejecutar en un clúster?. map. sort. shuffle. reduce.

¿Qué es HDFS?. Un sistema de almacenamiento distribuido de Hadoop. Un sistema de análisis de datos de Hadoop. Un sistema de procesamiento de datos de Hadoop.

¿Qué inspiró la creación de HDFS?. El paper de Google File System. El sistema de almacenamiento de Facebook. El sistema de almacenamiento de Amazon.

¿Cuál es una de las características principales de Hadoop Distributed File System (HDFS)?. Es un sistema que no requiere servidores específicos o costosos. Tiene una orientación "write-many, read-many", lo que significa que los archivos se pueden escribir y leer varias veces. No está diseñado para almacenar archivos de gran tamaño. No está optimizado para hacer operaciones de lectura o escritura masivas.

¿Qué es el sistema de permisos que utiliza HDFS?. Un sistema que permite leer, escribir y ejecutar ficheros. Un sistema que permite leer y escribir ficheros, pero no ejecutarlos. Un sistema que permite leer y ejecutar ficheros, pero no escribirlos. Un sistema que solo permite leer ficheros.

¿Qué es el "write-once, read many" que utiliza HDFS?. Permite escribir y leer archivos varias veces. Permite escribir un archivo una sola vez y leerlo muchas veces. No permite escribir archivos. No permite leer archivos.

¿Qué tipo de datos puede almacenar HDFS?. Solo datos estructurados. Solo datos semiestructurados. Solo datos sin estructura. Datos estructurados, semiestructurados o sin estructura.

¿Qué es el factor de replicación en HDFS?. El número de nodos en los que se almacena cada bloque. La cantidad de espacio en disco que se reserva para almacenar los bloques. El número de copias que se hacen de cada bloque en diferentes nodos.

¿Cómo se consigue la tolerancia a fallos en HDFS?. Mediante la replicación de cada bloque en varios nodos diferentes. La replicación no tiene nada que ver con la tolerancia a fallos en HDFS. Mediante la reducción del tamaño de los bloques de ficheros. Mediante sistemas de redundancia de hardware para garantizar la tolerancia a fallos.

¿Cuál es la función del nodo Namenode en HDFS?. Almacenar los bloques que componen cada fichero. Mantener la metainformación de todo el sistema de ficheros. Tomar puntos de control de los metadatos del sistema de ficheros del Namenode.

¿Qué información almacena el Namenode?. La estructura de directorios y subdirectorios. La información de los ficheros: tamaño, fecha de modificación, propietario, permisos, etc. El factor de replicación de cada fichero. Todas las anteriores.

¿Cuál es la función del Secondary Namenode?. Almacenar los bloques que componen cada fichero. Tomar puntos de control de los metadatos del sistema de ficheros del Namenode. Leer los bloques que componen los ficheros que están almacenados en HDFS.

¿Qué es FsImage en HDFS?. Una lista actualizada de los bloques y su ubicación. Un registro de los cambios que se producen en los metadatos del sistema de archivos. Una instantánea de los metadatos del sistema de archivos HDFS que se realiza cada cierto tiempo.

¿Cómo garantizan los Datanodes la integridad de los bloques que almacenan?. Almacenando la ubicación de los distintos bloques. Enviando al Namenode la lista de los bloques que almacenan. Almacenando un checksum para detectar si el bloque está corrupto.

¿Qué hardware se utiliza para el Namenode en HDFS?. Hardware similar al utilizado para los Datanodes. Hardware menos resiliente que el utilizado para los Datanodes. Hardware más resiliente que el utilizado para los Datanodes.

Une cada nodo de HDFS con su función. Namenode. Secondary Namenode. Datanode.

Relaciona cada punto único de fallo con su sistema: YARN. HDFS.

¿Cuál es la característica principal de los datos escritos en HDFS?. Son modificables. Son inmutables. Son comprimidos.

¿Cuál es el tamaño mínimo de bloque de lectura en HDFS?. 64 megabytes. 128 megabytes. 256 megabytes.

¿Qué tipo de operaciones básicas proporciona HDFS para trabajar con ficheros?. Leer, escribir y modificar un fichero. Leer y escribir un fichero. Copiar y pegar un fichero.

¿Qué responsabilidad tiene el Namenode en el proceso de lectura de un fichero?. Leer cada bloque y comunicarlo al cliente. Devolver al cliente la lista de bloques y la ubicación de los mismos. Comunicarse directamente con los Datanodes.

¿Qué responsabilidad tiene el Namenode en el proceso de escritura de un fichero?. Generar los bloques del fichero. Resolver las cuestiones relacionadas con la ubicación de cada bloque. Escribir los datos en los Datanodes.

¿Cuál es la implicación principal de la replicación en HDFS?. Permite tener una mayor tolerancia a fallos. Mejora el rendimiento en las operaciones de lectura. Reduce el espacio necesario para almacenar los ficheros.

Durante la operación de lectura de un fichero, los datos pasan por el Namenode. Verdadero. Falso.

Relaciona cada elemento del core de Hadoop con su definición: HDFS. YARN. MapReduce.

¿Qué interfaz de HDFS no está escrito en Java?. Cliente de línea de comandos. Java API. RestFul API(WebHDFS). Librería C.

¿Qué opción se utiliza en el comando ls de HDFS para hacer un listado recursivo?. -f. -d. -h. -R.

¿Qué comando de HDFS se utiliza para eliminar un archivo de forma recursiva?. rm. cp. ls. put.

HDFS no ofrece la posibilidad de usar su funcionalidad mediante un servicio HTTP mediante el protocolo WebHDFS. Verdadero. Falso.

¿Cuál es la función principal de YARN en Hadoop?. Proporcionar una capa de almacenamiento para los dato. Ejecutar todas las aplicaciones de procesamiento o análisis de datos. Proporcionar un sistema operativo para Hadoop. Controlar el acceso a los datos almacenados en HDFS.

¿Qué es YARN según su acrónimo?. Un framework de procesamiento distribuido. Un gestor de recursos. Un modelo de programación eficiente.

¿Por qué MapReduce era limitado en cuanto a las aplicaciones que se podían desarrollar?. Porque era un modelo de programación muy eficiente. Porque restringía el tipo de aplicaciones que los desarrolladores podían realizar. Porque permitía el procesamiento en tiempo real.

¿Qué tarea realiza YARN al ofrecer un API a las aplicaciones?. Ejecutar las aplicaciones en el clúster. Ofrecer un API menos estricto que MapReduce. Sincronizar la ejecución simultánea de las aplicaciones.

¿Cuál es una de las tareas de YARN al gestionar los recursos del clúster disponibles?. Vigilar qué nodos están activos. Monitorizar la ejecución de las aplicaciones. Asignar prioridades a las aplicaciones.

¿Qué afirmación es correcta sobre YARN?. YARN es el único motor de computación en Hadoop. YARN es un modelo de programación eficiente. YARN es un gestor de recursos que permite la ejecución de diferentes aplicaciones en el clúster.

¿Qué tareas realiza YARN al sincronizar la ejecución simultánea de las aplicaciones?. Asignar recursos a las aplicaciones. Configurar las políticas de prioridad de las aplicaciones. Monitorizar la ejecución de las aplicaciones.

En las primeras versiones de Hadoop, todo el procesamiento se realizaba con YARN. Verdadero. Falso.

YARN ofrece un API a las aplicaciones que es más estricto que el de MapReduce. Verdadero. Falso.

¿Qué es un contenedor en YARN?. Es la unidad mínima de recursos de ejecución para las aplicaciones. Es un tipo de nodo worker en YARN. Es un servicio que gestiona la ejecución de todas las tareas en YARN.

¿En qué se diferencian los nodos maestro y worker en YARN?. El nodo maestro es el encargado de coordinar y controlar la ejecución de todas las tareas, mientras que los nodos worker son los que realmente ejecutan las tareas. El nodo maestro y los nodos worker son lo mismo. Los nodos worker son los que se comunican con los clientes que quieren ejecutar aplicaciones en YARN.

¿Cómo se asignan los contenedores en YARN?. YARN asigna un conjunto de contenedores a cada tarea dependiendo de la demanda de la aplicación y la disponibilidad de los contenedores en el clúster. Cada tarea se ejecuta en su propio contenedor. Los contenedores se asignan de forma aleatoria en el clúster.

¿Cuál es la función del ResourceManager en YARN?. Coordinar, asignar y controlar la ejecución de todas las tareas en YARN. Asignar prioridades y establecer los recursos/contenedores que disfrutará cada aplicación. Gestionar la ejecución de todas las tareas en YARN.

¿Qué es el ApplicationsMaster en YARN?. Es el servicio que recibe las peticiones de ejecución por parte de los clientes y libera los recursos una vez las tareas han finalizado. Es el servicio que coordina la ejecución de las tareas, monitoriza la ejecución, solventa los fallos en las ejecuciones, y libera los recursos una vez las tareas han finalizado. Es el servicio que distribuye las aplicaciones por los nodos worker, asigna los recursos, coordina la ejecución de las tareas, monitoriza la ejecución, solventa los fallos en las ejecuciones, y libera los recursos una vez las tareas han finalizado.

¿Cuál es el papel del Scheduler en YARN?. Asignar prioridades y establecer los recursos/contenedores que disfrutará cada aplicación. Coordinar la ejecución de todas las tareas en YARN. Distribuir las aplicaciones por los nodos worker y asignar los recursos.

¿Qué es el ResourceManager en YARN?. Un servicio que actúa como nodo maestro y controla la ejecución de todas las tareas en YARN. Un servicio que monitoriza el estado de ejecución de las tareas en el nodo worker. Un servicio que asigna prioridades y establece los recursos para cada aplicación en YARN.

¿Qué es el Scheduler en YARN?. Un servicio que actúa como nodo maestro y controla la ejecución de todas las tareas en YARN. Un servicio que monitoriza el estado de ejecución de las tareas en el nodo worker. Un servicio que asigna prioridades y establece los recursos para cada aplicación en YARN.

Todos los contenedores en YARN tienen el mismo tamaño de memoria por defecto. Verdadero. Falso.

La cantidad de tareas que se pueden ejecutar en YARN está limitada por la cantidad de contenedores que tiene un clúster. Verdadero. Falso.

Relaciona cada componente del Resource Manager con sus funciones: ApplicationsMaster. ResourceManager. Scheduler.

Relaciona cada servicio de YARN con sus funciones: Resource Manager. Scheduler.

¿Qué es YARN?. Un sistema operativo. Un framework de procesamiento distribuido de datos. Una herramienta de gestión de bases de datos.

¿Qué es el ResourceManager de YARN?. Una herramienta para la gestión de recursos de un clúster. Un programa que ejecuta las tareas en un clúster. Un sistema operativo para la gestión de nodos.

¿Quién se comunica con el ResourceManager para solicitar la ejecución de una aplicación?. El NodeManager. El ApplicationMaster. El cliente.

¿Qué es el ApplicationsMaster en YARN?. Un programa que ejecuta las tareas en un clúster. Una herramienta para la gestión de recursos de un clúster. Un proceso que se encarga de coordinar la ejecución de una aplicación en el clúster.

¿Qué función tiene el Scheduler en YARN?. Se encarga de la gestión de recursos en el clúster. Se encarga de la planificación de tareas en el clúster. Se encarga de la comunicación entre el cliente y el ResourceManager.

¿Qué información envía el NodeManager al ResourceManager?. El código/ejecutable de la aplicación a ejecutar. Información sobre el consumo de recursos y el estado del nodo. Información sobre la prioridad de la tarea a ejecutar.

¿Cuál es la función de MapReduce en el procesamiento de grandes cantidades de datos?. Dividir el conjunto de datos de entrada en pequeños fragmentos y procesarlos por separado. Realizar la monitorización y control de errores. Implementar código complejo y repetitivo.

¿Qué permite hacer MapReduce?. Escribir fácilmente aplicaciones que procesan grandes cantidades de datos en paralelo en grandes clústeres de hardware commodity de manera confiable y tolerante a fallos. Monitorizar la ejecución de trabajos. Desarrollar código complejo y repetitivo. Ninguna de las anteriores.

¿Qué significa que MapReduce se ejecuta en paralelo?. La ejecución se divide en partes pequeñas y cada parte se ejecuta en paralelo, lo que facilita la escalabilidad o la tolerancia a fallos. La ejecución se realiza en serie, lo que dificulta la escalabilidad o la tolerancia a fallos. La ejecución se realiza en diferentes máquinas, pero no en paralelo.

MapReduce es una tecnología que ya no se utiliza apenas. Verdadero. Falso.

En MapReduce, los desarrolladores deben implementar código complejo y repetitivo. Verdadero. Falso.

YARN, en concreto, el ResourceManager, es invocado por los clientes cuando quieren lanzar una aplicación en el clúster para su ejecución. La secuencia de ejecución de una aplicación es la siguiente: 1. 2. 3. 4. 5. 6.

Denunciar Test

▲