Cuestiones
ayuda
option
Mi Daypo

TEST BORRADO, QUIZÁS LE INTERESEBDA_2

COMENTARIOS ESTADÍSTICAS RÉCORDS
REALIZAR TEST
Título del test:
BDA_2

Descripción:
Big Data Aplicado

Autor:
AKENATON
(Otros tests del mismo autor)

Fecha de Creación:
09/04/2024

Categoría:
Informática

Número preguntas: 57
Comparte el test:
Facebook
Twitter
Whatsapp
Comparte el test:
Facebook
Twitter
Whatsapp
Últimos Comentarios
No hay ningún comentario sobre este test.
Temario:
¿Cómo se llama el nodo que coordina la ejecución de trabajos en YARN? a) Scheduler b) NodeManager c) NameNode d) ResourceManager.
¿Cuál es el comando de HDFS para llevar un fichero desde el disco del nodo frontera hasta HDFS? a) put b) cp c) mv d) mv external.
¿Cuál es el comando de HDFS para crear un directorio? a) rmdir b) create dir c) mkdir d) make_dir.
¿Cuál es el tamaño por defecto de un bloque en HDFS?: a) 128 GB b) 128 MB c) 64 GB d) 64 MB.
Si en HDFS un fichero indica que tiene permisos rwxrwxrwx, ¿quién puede modificar el fichero?: a) Todos los usuarios. b) En HDFS no se pueden modificar los ficheros. c) Todos los usuarios menos el que creó el fichero. d) El usuario que lo creó.
¿Cuál es el comando de HDFS para modificar el factor de replicación de un fichero? a) mod rf b) setrep c) mod d) chmod.
¿Cuál es el comando de HDFS para ver el contenido de un fichero? a) read b) cat c) ls d) open.
¿Qué métodos se suelen desarrollar para hacer un programa MapReduce? a) Map, Reduce y shuffle. b) Map, Reduce y Order. c) Map y Reduce. d) Ninguno, MapReduce se encarga de todo.
¿Cuál se los siguientes servicios se ejecutan en más de un nodo en HDFS? a) Namenode b) Secondary Namenode c) Datanode.
¿Cuál de los siguientes servicios de YARN es crítico, de manera que representa un punto único de fallo y que sin él, no se podrían ejecutar aplicaciones? a) Namenode b) ApplicationMaster c) ResourceManager d) NodeManager.
¿Qué es HDFS? a) Un sistema de almacenamiento distribuido de Hadoop. b) Un sistema de análisis de datos de Hadoop. c) Un sistema de procesamiento de datos de Hadoop.
¿Qué inspiró la creación de HDFS? a) El paper de Google File System. b) El sistema de almacenamiento de Facebook. c) El sistema de almacenamiento de Amazon.
¿Cuál es una de las características principales de Hadoop Distributed File System (HDFS)? a) Es un sistema que no requiere servidores específicos o costosos. b) Tiene una orientación "write-many, read-many", lo que significa que los archivos se pueden escribir y leer varias veces. c) No está diseñado para almacenar archivos de gran tamaño. d) No está optimizado para hacer operaciones de lectura o escritura masivas.
¿Qué es el sistema de permisos que utiliza HDFS? a) Un sistema que permite leer, escribir y ejecutar ficheros. b) Un sistema que permite leer y escribir ficheros, pero no ejecutarlos. c) Un sistema que permite leer y ejecutar ficheros, pero no escribirlos. d) Un sistema que solo permite leer ficheros.
¿Qué es el "write-once, read many" que utiliza HDFS? a) Permite escribir y leer archivos varias veces. b) Permite escribir un archivo una sola vez y leerlo muchas veces. c) No permite escribir archivos. d) No permite leer archivos.
¿Qué tipo de datos puede almacenar HDFS? a) Solo datos estructurados. b) Solo datos semiestructurados. c) Solo datos sin estructura. d) Datos estructurados, semiestructurados o sin estructura.
¿Qué es el factor de replicación en HDFS? a) El número de nodos en los que se almacena cada bloque. b) La cantidad de espacio en disco que se reserva para almacenar los bloques. c) El número de copias que se hacen de cada bloque en diferentes nodos.
¿Cómo se consigue la tolerancia a fallos en HDFS? a) Mediante la replicación de cada bloque en varios nodos diferentes. b) La replicación no tiene nada que ver con la tolerancia a fallos en HDFS c) Mediante la reducción del tamaño de los bloques de ficheros d) Mediante sistemas de redundancia de hardware para garantizar la tolerancia a fallos.
¿Cuál es la función del nodo Namenode en HDFS? a) Almacenar los bloques que componen cada fichero. b) Mantener la metainformación de todo el sistema de ficheros. c) Tomar puntos de control de los metadatos del sistema de ficheros del Namenode.
¿Qué información almacena el Namenode? a) La estructura de directorios y subdirectorios. b) La información de los ficheros: tamaño, fecha de modificación, propietario, permisos, etc. c) El factor de replicación de cada fichero. d) Todas las anteriores.
¿Cuál es la función del Secondary Namenode? a) Almacenar los bloques que componen cada fichero. b) Tomar puntos de control de los metadatos del sistema de ficheros del Namenode. c) Leer los bloques que componen los ficheros que están almacenados en HDFS.
¿Qué es FsImage en HDFS? a) Una lista actualizada de los bloques y su ubicación. b) Un registro de los cambios que se producen en los metadatos del sistema de archivos. c) Una instantánea de los metadatos del sistema de archivos HDFS que se realiza cada cierto tiempo.
¿Cómo garantizan los Datanodes la integridad de los bloques que almacenan? a) Almacenando la ubicación de los distintos bloques. b) Enviando al Namenode la lista de los bloques que almacenan. c) Almacenando un checksum para detectar si el bloque está corrupto.
¿Qué hardware se utiliza para el Namenode en HDFS? a) Hardware similar al utilizado para los Datanodes. b) Hardware menos resiliente que el utilizado para los Datanodes. c) Hardware más resiliente que el utilizado para los Datanodes.
¿Cuál es la característica principal de los datos escritos en HDFS? a) Son modificables. b) Son inmutables. c) Son comprimidos.
¿Qué tipo de operaciones básicas proporciona HDFS para trabajar con ficheros? a) Leer, escribir y modificar un fichero. b) Leer y escribir un fichero. c) Copiar y pegar un fichero.
¿Qué responsabilidad tiene el Namenode en el proceso de lectura de un fichero? a) Leer cada bloque y comunicarlo al cliente b) Devolver al cliente la lista de bloques y la ubicación de los mismos c) Comunicarse directamente con los Datanodes.
¿Qué responsabilidad tiene el Namenode en el proceso de escritura de un fichero? a) Generar los bloques del fichero. b) Resolver las cuestiones relacionadas con la ubicación de cada bloque c) Escribir los datos en los Datanodes.
¿Cuál es la implicación principal de la replicación en HDFS? a) Permite tener una mayor tolerancia a fallos. b) Mejora el rendimiento en las operaciones de lectura. c) Reduce el espacio necesario para almacenar los ficheros.
¿Cuál es la implicación principal de la replicación en HDFS? a) Permite tener una mayor tolerancia a fallos b) Mejora el rendimiento en las operaciones de lectura c) Reduce el espacio necesario para almacenar los ficheros.
¿Qué interfaz de HDFS no está escrito en Java? a) Cliente de línea de comandos. b) Java API. c) RestFul API(WebHDFS). d) Librería C.
¿Qué opción se utiliza en el comando ls de HDFS para hacer un listado recursivo? a) -f b) -d c) -h d) -R.
¿Qué comando de HDFS se utiliza para eliminar un archivo de forma recursiva? a) rm b) cp c) ls d) put.
¿Cuál es la función principal de YARN en Hadoop? a) Proporcionar una capa de almacenamiento para los dato. b) Ejecutar todas las aplicaciones de procesamiento o análisis de datos. c) Proporcionar un sistema operativo para Hadoop d) Controlar el acceso a los datos almacenados en HDFS.
¿Qué es YARN según su acrónimo? a) Un framework de procesamiento distribuido. b) Un gestor de recursos. Un modelo de programación eficiente.
¿Por qué MapReduce era limitado en cuanto a las aplicaciones que se podían desarrollar? a) Porque era un modelo de programación muy eficiente b) Porque restringía el tipo de aplicaciones que los desarrolladores podían realizar c) Porque permitía el procesamiento en tiempo real.
¿Qué tarea realiza YARN al ofrecer un API a las aplicaciones? a) Ejecutar las aplicaciones en el clúster b) Ofrecer un API menos estricto que MapReduce c) Sincronizar la ejecución simultánea de las aplicaciones.
¿Cuál es una de las tareas de YARN al gestionar los recursos del clúster disponibles? a) Vigilar qué nodos están activos b) Monitorizar la ejecución de las aplicaciones c) Asignar prioridades a las aplicaciones.
¿Qué afirmación es correcta sobre YARN? a) YARN es el único motor de computación en Hadoop. b) YARN es un modelo de programación eficiente. c) YARN es un gestor de recursos que permite la ejecución de diferentes aplicaciones en el clúster.
¿Qué tareas realiza YARN al sincronizar la ejecución simultánea de las aplicaciones? a) Asignar recursos a las aplicaciones b) Configurar las políticas de prioridad de las aplicaciones c) Monitorizar la ejecución de las aplicaciones.
¿Qué es un contenedor en YARN? a) Es la unidad mínima de recursos de ejecución para las aplicaciones. b) Es un tipo de nodo worker en YARN. c) Es un servicio que gestiona la ejecución de todas las tareas en YARN.
¿En qué se diferencian los nodos maestro y worker en YARN? a) El nodo maestro es el encargado de coordinar y controlar la ejecución de todas las tareas, mientras que los nodos worker son los que realmente ejecutan las tareas. b) El nodo maestro y los nodos worker son lo mismo. c) Los nodos worker son los que se comunican con los clientes que quieren ejecutar aplicaciones en YARN.
¿Cómo se asignan los contenedores en YARN? a) YARN asigna un conjunto de contenedores a cada tarea dependiendo de la demanda de la aplicación y la disponibilidad de los contenedores en el clúster. b) Cada tarea se ejecuta en su propio contenedor. c) Los contenedores se asignan de forma aleatoria en el clúster.
¿Cuál es la función del ResourceManager en YARN? a) Coordinar, asignar y controlar la ejecución de todas las tareas en YARN. b) Asignar prioridades y establecer los recursos/contenedores que disfrutará cada aplicación. c) Gestionar la ejecución de todas las tareas en YARN.
¿Qué es el ApplicationsMaster en YARN? a) Es el servicio que recibe las peticiones de ejecución por parte de los clientes y libera los recursos una vez las tareas han finalizado. b) Es el servicio que coordina la ejecución de las tareas, monitoriza la ejecución, solventa los fallos en las ejecuciones, y libera los recursos una vez las tareas han finalizado. c) Es el servicio que distribuye las aplicaciones por los nodos worker, asigna los recursos, coordina la ejecución de las tareas, monitoriza la ejecución, solventa los fallos en las ejecuciones, y libera los recursos una vez las tareas han finalizado.
¿Cuál es el papel del Scheduler en YARN? a) Asignar prioridades y establecer los recursos/contenedores que disfrutará cada aplicación. b) Coordinar la ejecución de todas las tareas en YARN. c) Distribuir las aplicaciones por los nodos worker y asignar los recursos.
¿Qué es el ResourceManager en YARN? a) Un servicio que actúa como nodo maestro y controla la ejecución de todas las tareas en YARN. b) Un servicio que monitoriza el estado de ejecución de las tareas en el nodo worker. c) Un servicio que asigna prioridades y establece los recursos para cada aplicación en YARN.
¿Qué es el Scheduler en YARN? a) Un servicio que actúa como nodo maestro y controla la ejecución de todas las tareas en YARN. b) Un servicio que monitoriza el estado de ejecución de las tareas en el nodo worker. c) Un servicio que asigna prioridades y establece los recursos para cada aplicación en YARN.
¿Qué es YARN? a) Un sistema operativo. b) Un framework de procesamiento distribuido de datos. c) Una herramienta de gestión de bases de datos.
¿Qué es el ResourceManager de YARN? a) Una herramienta para la gestión de recursos de un clúster. b) Un programa que ejecuta las tareas en un clúster. c) Un sistema operativo para la gestión de nodos.
¿Quién se comunica con el ResourceManager para solicitar la ejecución de una aplicación? a) El NodeManager b) El ApplicationMaster c) El cliente.
¿Qué es el ApplicationsMaster en YARN? a) Un programa que ejecuta las tareas en un clúster b) Una herramienta para la gestión de recursos de un clúster c) Un proceso que se encarga de coordinar la ejecución de una aplicación en el clúster.
¿Qué función tiene el Scheduler en YARN? a) Se encarga de la gestión de recursos en el clúster. b) Se encarga de la planificación de tareas en el clúster. c) Se encarga de la comunicación entre el cliente y el ResourceManager.
¿Qué información envía el NodeManager al ResourceManager? a) El código/ejecutable de la aplicación a ejecutar. b) Información sobre el consumo de recursos y el estado del nodo. c) Información sobre la prioridad de la tarea a ejecutar.
¿Cuál es la función de MapReduce en el procesamiento de grandes cantidades de datos? a) Dividir el conjunto de datos de entrada en pequeños fragmentos y procesarlos por separado. b) Realizar la monitorización y control de errores. c) Implementar código complejo y repetitivo.
¿Qué permite hacer MapReduce? a) Escribir fácilmente aplicaciones que procesan grandes cantidades de datos en paralelo en grandes clústeres de hardware commodity de manera confiable y tolerante a fallos. b) Monitorizar la ejecución de trabajos. c) Desarrollar código complejo y repetitivo. d) Ninguna de las anteriores.
¿Qué significa que MapReduce se ejecuta en paralelo? a) La ejecución se divide en partes pequeñas y cada parte se ejecuta en paralelo, lo que facilita la escalabilidad o la tolerancia a fallos. b) La ejecución se realiza en serie, lo que dificulta la escalabilidad o la tolerancia a fallos. c) La ejecución se realiza en diferentes máquinas, pero no en paralelo.
Denunciar test Consentimiento Condiciones de uso