option
Cuestiones
ayuda
daypo
buscar.php

IPMD_AB

COMENTARIOS ESTADÍSTICAS RÉCORDS
REALIZAR TEST
Título del Test:
IPMD_AB

Descripción:
IPMD_AB examenes

Fecha de Creación: 2026/01/21

Categoría: Otros

Número Preguntas: 30

Valoración:(0)
COMPARTE EL TEST
Nuevo ComentarioNuevo Comentario
Comentarios
NO HAY REGISTROS
Temario:

Elija la respuesta INCORRECTA sobre Impala: A. Está orientado a consultas interactivas. B. Está orientado a consultas en bloque. C. Realiza las consultas sobre su propia red de demonios. D. Trabaja principalmente en memória.

En HDFS, ¿qué fallo es menos problemático?. A. La caída de un NameNode. B. La caída de un DataNode. C. La caída de todos los NameNodes. D. Todos los fallos son igual de problemáticos.

3.En Spark, si no cacheamos un DataFrame que utilizaremos en várias operaciones independientes. A. Podríamos tardar más tiempo del estrictamente necesario. B. Podríamos obtener resultados incorrectos. C. Sería imposible reconstruir las particiones perdidas si falla un nodo. D. Todas las opciones anteriores son ciertas.

¿Cuál de las siguientes afirmaciones acerca de Hive y BigQuery NO es cierta?. A. Ambos son sistemas de Data Warehouse. B. Ambos poseen su propio motor de ejecución y no necesitan una herramienta externa para ejecutar consultas. C. Ambas son herramientas open-source. D. Las opciones B y C son falsas.

5. Uno de los principales problemas de los RDD es que... A. Se ejecutan siempre en el proceso driver. B. No permiten replicación de sus particiones. C. Sólo pueden ser manejados desde el lenguaje Scala. D. El programador debe conocer exactamente la estructura de los objetos que lo componen.

6. Para comunicar los servicios contratados (almacenamiento, computación, base de datos...) en una plataforma de cloud computing (elija la respuesta correcta): A. Todos los servicios existentes en una plataforma de cloud computing para todos los usuarios de la misma están comunicados entre sí automáticamente. B. No es posible comunicar servicios entre sí dentro de la plataforma de cloud computing, sino que es necesario crear una red externa para comunicarlos. C. Cada usuario de la plataforma de cloud computing puede crear únicamente una red virtual dentro de la plataforma para conectar todos los servicios que contrate. D. Ninguna de las anteriores.

7. Cuál de las siguientes afirmaciones sobre los servicios de cloud computing es cierta: A. Están diseñadas explícitamente para resolver problemas de big data y machine learning. B. No son una buena elección para desarrollar aplicaciones móviles. C. Entre las aplicaciones que más usan servicios de cloud computing están las aplicaciones IoT (Internet of Things). D. Ninguna de las anteriores.

8. Cuando utilizamos herramientas de cloud computing de un proveedor, ... A. Los desarrolladores no pueden instalar tecnologías open-source si usan la infraestructura de ese proveedor. B. Los desarrolladores pueden usar herramientas open-source para cualquier tarea. C. Los desarrolladores tienen que usar los servicios PaaS de ese proveedor. D. El desarrollo debe llevarlo a cabo un equipo de desarrolladores del proveedor.

9. Se quiere ajustar un modelo predictivo de análisis de sentimiento a un conjunto masivo de textos, usando Spark MLlib. Antes de entrenar el algoritmo predictivo, es necesario pre-procesarlos (dividir en palabras, quitar palabras sin significado, y codificarlas como números). Algunas de estas operaciones son estimadores y otras son transformadores. ¿Cuál sería la manera correcta de proceder?. A. Crear estimadores y transformadores independientes, haciendo fit o transform sobre cada uno según corresponda. B. Crear un pipeline sólo con los estimadores, ejecutar fit sobre el pipeline y después ejecutar transform sobre los transformadores. C. Crear un pipeline con todos los estimadores y transformadores necesarios, y ejecutar fit sobre el pipeline. D. Crear un pipeline sólo con los transformadores, ejecutar fit sobre el pipeline y después usar transform sobre los estimadores.

10. Se quiere desplegar un producto big data en una plataforma de cloud computing. Por requisitos del producto, se requiere tener el mayor control posible del servidor o servidores donde se despliegue dicho producto. ¿Qué solución de las disponibles elegiría?. A. IaaS. B. PaaS. C. FaaS. D. SaaS.

¿Cuál de las siguientes situaciones no es habitual en Spark Structured Streaming?. A. Entrenar un modelo predictivo en tiempo real. B. Refrescar una agregación que estamos guardando en una tabla. C. Comprobar y consolidar datos recibidos en tiempo real antes de guardarlos. D. Todas las respuestas anteriores son habituales con Spark Structured Streaming.

12. Al hacer resultado_df = df.withColumn("c", F.lit(3))... A. Spark solo materializa df si lo habíamos marcado como cacheado antes de esta línea. B. Spark no materializa el resultado por ser una transformación. C. Spark materializa el resultado por ser una acción. D. Spark materializa el resultado en el momento de hacer resultado_df.cache().

13. ¿Cuál es el servicio de Azure equivalente a Amazon S3?. A. Azure Cognitive Services. B. Azure DataLake Storage. C. Azure Cosmos. D. Azure SQL Database.

14. ¿Qué implica una transformación narrow en Spark?. A. Movimientos de datos entre nodos. B. Uso intensivo de la memoria RAM. C. Replicación de particiones. D. Cada partición da lugar a otra en el mismo nodo.

15. Si un productor en Kafka configura acks=all, ¿qué implica?. A. Mayor latencia. B. Mayor rendimiento. C. Entrega más rápida de mensajes. D. Mayor riesgo de pérdida de mensajes.

1. En el sistema de ficheros HDFS, cuando se solicita la lectura de un fichero: A. Es el cliente quien proporciona los metadatos al namenode. B. Es el namenode quien proporciona los metadatos al cliente. C. Es el namenode quien proporciona los bloques del fichero al cliente. D. Es el datanode quien proporciona los metadatos al cliente.

2. ¿Cuál es el propósito del DAG en Spark?. A. Optimizar consultas SQL. B. Mantener la trazabilidad y resiliencia. C. Replicar particiones. D. Ejecutar acciones inmediatamente.

3. Si un productor en Kafka configura acks=all, ¿qué implica?. A. Mayor latencia. B. Mayor rendimiento. C. Entrega más rápida de mensajes. D. Mayor riesgo de pérdida de mensajes.

4. Cuál de los siguientes servicios de seguridad NO ofrecen las plataformas de cloud computing estudiadas: A. Responsabilidad sobre los datos de la aplicación. B. Gestión de identidad. C. Control de acceso. D. Autenticación y autorización.

5. Se quiere ajustar un modelo predictivo de análisis de sentimiento a un conjunto masivo de textos, usando Spark MLlib. Antes de entrenar el algoritmo predictivo, es necesario pre-procesarlos (dividir en palabras, quitar palabras sin significado, y codificarlas como números). Algunas de estas operaciones son estimadores y otras son transformadores. ¿Cuál sería la manera correcta de proceder?. A. Crear estimadores y transformadores independientes, haciendo fit o transform sobre cada uno según corresponda. B. Crear un pipeline sólo con los estimadores, ejecutar fit sobre el pipeline y después ejecutar transform sobre los transformadores,. C. Crear un pipeline con todos los estimadores y transformadores necesarios, y ejecutar fit sobre el pipeline. D. Crear un pipeline sólo con los transformadores, ejecutar fit sobre el pipeline y después usar transform sobre los estimadores.

6. Cuando aplicamos el método fit a un Estimator de Spark, pasando como argumento un DataFrame... A. Nos devuelve como resultado otro estimador. B. Nos devuelve como resultado un transformador. C. Nos devuelve como resultado el DataFrame ajustado. D. No es posible aplicar fit a un Estimator.

7. ¿Cuál es el servicio de Azure equivalente a Amazon S3?. A. Azure Cognitive Services. B. Azure DataLake Storage. C. Azure Cosmos. D. Azure SQL Database.

8. Cuando utilizamos herramientas de cloud computing de un proveedor. A. Los desarrolladores no pueden instalar tecnologías open-source si usan la infraestructura de ese proveedor. B. Los desarrolladores pueden usar herramientas open-source para cualquier tarea. C. Los desarrolladores tienen que usar los servicios PaaS de ese proveedor. D. El desarrollo debe llevarlo a cabo un equipo de desarrolladores del proveedor.

9. ¿Cuál de las siguientes definiciones corresponde al concepto de task (tarea) de Spark?. A. Procesamiento de una partición completa de un RDD en un core. B. Procesamiento para llevar a cabo una acción sobre un DataFrame. C. Procesamiento en el que se encadenan operaciones que no requieren movimiento de datos. D. Procesamiento para completar una transformación de un DataFrame.

10. ¿Cuál es la razón principal por la que utilizaríamos la biblioteca de Spark ML en lugar de cualquier otra para entrenar un modelo?. A. Crear modelos predictivos sobre datos en tiempo real. B. Crear modelos predictivos más complejos que una regresión lineal. C. Crear modelos predictivos sobre datos masivos. D. Todas las respuestas anteriores son correctas.

11. ¿Cómo almacena la información Kafka para ser consumida?. A. En ficheros en formato binario. B. En el metastore. C. En HDFS. D. Ninguna de las respuestas anteriores es cierta.

12. ¿Cuál de los siguientes elementos NO forma parte de la arquitectura de Impala?. A. Apache Spark. B. impalad. C. Conector ODBC. D. catalogd.

13. ¿Cuál de las siguientes afirmaciones acerca de Hive y BigQuery NO es cierta?. A. Ambos son sistemas de Data Warehouse. B. Ambos poseen su propio motor de ejecución y no necesitan una herramienta externa para ejecutar consultas. C. Ambas son herramientas open-source. D. Las opciones B y C son falsas.

14. En una tabla manejada de Hive ... A. El borrado de la tabla implica el borrado de los datos. B. El borrado de la tabla no afecta a los datos, que permanecerán en la misma ubicación. C. Al ser manejada por Hive, las herramientas de BI no pueden acceder a esos datos. D. Ninguna de las opciones anteriores es correcta.

15. Las acciones de Spark. A. No devuelven nada. B. Devuelven un valor. C. Devuelven una transformación. D. Devuelven un RDD.

Denunciar Test