option
Cuestiones
ayuda
daypo
buscar.php

BDA03 - 5

COMENTARIOS ESTADÍSTICAS RÉCORDS
REALIZAR TEST
Título del Test:
BDA03 - 5

Descripción:
Procesamiento en streaming

Fecha de Creación: 2023/04/12

Categoría: Otros

Número Preguntas: 43

Valoración:(0)
COMPARTE EL TEST
Nuevo ComentarioNuevo Comentario
Comentarios
NO HAY REGISTROS
Temario:

¿Qué diferencia hay entre Big Data y Fast Data?. Big Data procesa datos de forma continua. Fast Data procesa datos en bloques. Big Data procesa datos en movimiento. Fast Data procesa datos de gran volumen.

¿Qué tecnologías se suelen utilizar para procesar los datos en Fast Data?. HDFS y Hive. Spark y Hadoop. Streaming y Hadoop. Streaming y Spark.

¿Qué tipo de datos suele procesar el concepto Fast Data?. Datos que se generan de forma continua. Datos en reposo. Datos de gran volumen. Datos que se generan en bloques.

¿Qué ventaja ofrece el procesamiento en tiempo real de datos en streaming?. Mayor eficiencia en el procesamiento de grandes volúmenes de datos. Menor necesidad de almacenamiento. Mayor capacidad de procesamiento de datos en reposo. Ninguna ventaja con respecto al procesamiento de datos en bloques.

¿Qué es la garantía de procesamiento exactly once?. Garantiza que todos los datos se procesan una vez. Garantiza que todos los datos se procesan al menos una vez. Garantiza que algunos datos se procesan una vez. Garantiza que algunos datos se procesan al menos una vez.

¿Por qué la garantía de procesamiento exactly once es importante en el caso de uso de procesamiento de pagos con tarjeta?. Porque procesar los datos más de una vez podría generar problemas de cobro. Porque necesitamos procesar los datos al menos una vez. Porque necesitamos procesar los datos exactamente una vez. Porque procesar los datos más de una vez no tiene ninguna consecuencia negativa.

¿Qué es la garantía de procesamiento at-least-once?. Garantiza que todos los datos se procesan una vez. Garantiza que todos los datos se procesan al menos una vez. Garantiza que algunos datos se procesan una vez. Garantiza que algunos datos se procesan al menos una vez.

¿Por qué la garantía de procesamiento at-least-once puede ser un problema?. Porque garantiza que todos los datos se procesen exactamente una vez. Porque garantiza que todos los datos se procesen al menos dos veces. Porque en casos poco probables pero posibles, un dato se podría procesar dos veces. Porque la herramienta no garantiza la integridad de los datos.

¿Cuál es la diferencia principal entre la garantía de procesamiento exactly once y la garantía de procesamiento at-least-once?. La garantía de procesamiento exactly once garantiza que algunos datos se procesan una vez, mientras que la garantía de procesamiento at-least-once garantiza que todos los datos se procesan al menos una vez. La garantía de procesamiento exactly once garantiza que todos los datos se procesan una vez, mientras que la garantía de procesamiento at-least-once garantiza que algunos datos se procesan al menos una vez. La garantía de procesamiento exactly once garantiza que todos los datos se procesan exactamente una vez, mientras que la garantía de procesamiento at-least-once garantiza que todos los datos se procesan al menos una vez. La garantía de procesamiento exactly once garantiza que algunos datos se procesan exactamente una vez, mientras que la garantía de procesamiento at-least-once garantiza que todos los datos se procesan al menos una vez.

¿Por qué es importante conocer el nivel de garantía que ofrece una herramienta de streaming?. Porque determina el coste de la herramienta. Porque determina la cantidad de datos que se pueden procesar con ella. Porque ayuda a saber si se puede confiar en que todos los datos serán procesados correctamente. Porque indica la cantidad de servidores necesarios para procesar los datos.

¿Qué es el procesamiento en microbatch?. Procesar cada evento por separado según llega al sistema. Agrupar los eventos en una ventana temporal pequeña y procesarlos juntos. Procesar los eventos en pequeños lotes de eventos. Ninguna de las anteriores.

¿Qué ventaja tiene el procesamiento evento a evento?. Mayor latencia. Mayor ancho de banda (throughput). Permite procesar menos eventos por unidad de tiempo. Ninguna de las anteriores.

¿En qué casos se requerirá un procesamiento evento a evento?. Cuando se requiere una latencia mínima. Cuando se pretende generar un cuadro de mando con las métricas que se están recibiendo de los sensores. Ambas opciones son válidas. Ninguna de las anteriores.

¿Cuál es un ejemplo de caso de uso para un sistema que requiere una latencia mínima?. Generar un cuadro de mando con las métricas de los sensores de una fábrica. Detectar fraude en pagos por tarjeta de crédito. Ninguna de las anteriores. Ambas opciones son válidas.

¿Cuál es una desventaja del procesamiento en microbatch?. Mayor latencia. Mayor ancho de banda (throughput). Permite procesar menos eventos por unidad de tiempo. Ninguna de las anteriores.

¿Qué es Apache Storm?. Un framework de procesamiento de eventos. Un sistema operativo. Una distribución de Hadoop. Una herramienta de análisis de datos.

¿Qué es un Bolt en Apache Storm?. Una pieza que recoge los eventos desde el origen. Un flujo de procesamiento de eventos. Una pieza que envía los eventos a la topología. Un bloque de procesamiento en la topología.

¿Qué garantía de procesamiento ofrece Apache Storm de forma nativa?. Garantía exactly-once. Garantía al menos una vez. Garantía al menos dos veces. No ofrece garantía de procesamiento.

¿Qué es un Spout en Apache Storm?. Una pieza que recoge los eventos desde el origen. Un flujo de procesamiento de eventos. Una pieza que envía los eventos a la topología. Un bloque de procesamiento en la topología.

¿Qué tipo de latencia ofrece Apache Storm en su procesamiento evento a evento?. Milisegundos. Segundos. Minutos. Horas.

¿Qué es Trident en Apache Storm?. Un framework que garantiza el procesamiento exactly-once. Un lenguaje de programación compatible con Java. Un spout utilizado para recoger los eventos desde el origen. Un bolt que se encarga de validar los datos.

Relaciona los siguientes conceptos de Apache Storm. Spout. Bolt.

¿Qué es una topología en Apache Storm?. Un grafo dirigido acíclico que representa el flujo de procesamiento de eventos. Una fuente externa de eventos. Un framework utilizado para procesar datos. Una red de nodos conectados que procesan los eventos de manera distribuida.

¿Cuál es el componente de Spark que permite procesar flujos de datos en tiempo near-realtime?. Structured Streaming. Batch Processing. Apache Storm. Apache Hadoop.

¿Qué es un microbatch en el procesamiento de datos de Structured Streaming?. Un lote de datos recogido durante un período de tiempo. Un evento procesado en tiempo real. Una secuencia de operaciones en paralelo. Un método de Spark para el procesamiento batch.

¿Cuál es la principal ventaja de Spark en el procesamiento en streaming?. Permite reutilizar el código de procesamiento batch. Ofrece una garantía de procesamiento exactly-once. Tiene un ancho de banda muy alto. Permite procesar eventos en tiempo real.

¿Qué nivel de garantía de procesamiento ofrece Spark?. Exactly once. At least once. At most once. No garantiza el procesamiento de eventos.

¿Para qué tipo de casos de uso es válido el nivel de garantía de procesamiento exactly-once en Spark?. Para los casos en los que se requiere no duplicar el procesamiento de eventos. Para los casos en los que se requiere duplicar el procesamiento de eventos. Para los casos en los que se requiere procesar eventos con latencias bajas. Para los casos en los que se requiere procesar eventos con ancho de banda muy alto.

¿Qué es Apache Flink?. Un framework de procesamiento distribuido para batch processing. Un framework de procesamiento distribuido para streaming processing. Un framework de procesamiento distribuido para procesos iterativos. Ninguna de las anteriores.

¿Cómo se procesan los eventos en Apache Flink?. De forma batch. De forma streaming. De forma iterativa. Ninguna de las anteriores.

¿Qué tipo de procesamiento de eventos es válido en Apache Flink?. Procesamiento de eventos simples. Procesamiento de eventos complejos (CEP). Procesamiento de eventos por lotes. Ninguna de las anteriores.

¿En qué lenguajes se puede programar en Apache Flink?. Java y Scala. Python y SQL. Java, Scala y Python. Java, Scala, Python y SQL.

Relaciona cada componente de procesamiento en streaming con sus características. Apache Storm. Apache Spark. Apache Flink.

¿En qué se diferencia el concepto de Big Data y el de Fast Data?. El Big Data hace referencia a datos de gran volumen en reposo, mientras que el Fast Data hace referencia a datos en movimiento que se generan de forma continua y uno a uno. El Big Data hace referencia a datos en movimiento, mientras que el Fast Data hace referencia a datos de gran volumen en reposo. Ambos conceptos son sinónimos y se refieren a datos de gran volumen en reposo.

¿Qué garantía de procesamiento permite que todos los datos se procesen una vez, aunque haya una caída en el sistema?. At least once (al menos una vez). Exactly once (exactamente una vez). No se menciona ninguna garantía de procesamiento en el texto.

¿Qué herramientas permiten analizar los datos en tiempo real dentro del ecosistema Hadoop?. Apache Storm, Apache Flink y Apache Spark. Apache Hive, Apache Pig y Apache HBase. Apache Cassandra, Apache Kafka y Apache Solr.

Garantía de procesamiento: at least once vs exactly once. Exactly once (exactamente una vez). At-least-once (al menos una vez).

Procesamiento evento a evento (one-at-a-time) o en microbatch. procesamiento evento a evento. procesamiento en microbatch.

Cuando se comenzaron a implementar casos de uso Big Data, se implementaron pocos casos de tiempo real. Verdadero. Falso.

En la garantía de entrega at-least-once, podría darse el caso en que un evento no se llegue a procesar. Verdadero. Falso.

Siempre es mejor una solución de procesamiento de eventos one-at-a-time que una solución basada en micro-batch. Verdadero. Falso.

¿Qué es Apache Storm?. El primer framework de computación distribuida sobre Hadoop. Un componente de Spark que permite procesar flujos de datos en tiempo near-realtime. Un framework de procesamiento distribuido orientado a streaming.

¿Cuál es la característica principal de Apache Storm?. Realiza un procesamiento evento a evento (one-at-a-time) y en el momento de su ocurrencia. Garantía “at least once”. Procesamiento en microbatches.

Denunciar Test