Sistemas de Big Data #3
|
|
Título del Test:
![]() Sistemas de Big Data #3 Descripción: Test número 5 |



| Comentarios |
|---|
NO HAY REGISTROS |
|
¿Qué es un conjunto según la definición básica presentada en el curso?. Una colección de objetos distintos. Un grupo de elementos repetidos. Una lista ordenada de elementos. Una secuencia temporal de datos. En conjuntos, ¿Qué característica NO es propia de un conjunto?. Los elementos son distintos. Hay elementos repetidos. No hay orden específico. Se puede representar con notación matemática. ¿Cuál es el resultado de la operación de unión {1, 2, 3} ∪ {3, 4, 5}?. {1, 2, 3, 4, 5}. {1, 2, 3, 3, 4, 5}. {3}. {1, 2, 4, 5}. ¿Cuál es el resultado de la operación de intersección {1, 2, 3} ∩ {3, 4, 5}?. {1, 2}. {1, 2, 3, 4, 5}. {4, 5}. {3}. ¿Qué representa la notación x ∈ A en teoría de conjuntos?. x es subconjunto de A. x pertenece a A. x es igual a A. x no pertenece a A. ¿Cuál es el resultado de {1, 2, 3, 4} - {3, 4, 5}?. {5}. {1, 2, 5}. {1, 2}. {3, 4}. ¿Qué es una relación según el curso?. Una operación entre elementos. Un subconjunto del producto cartesiano A × B. Un conjunto de pares ordenados únicos. Una función entre dos conjuntos. ¿Cuál es la característica de una relación reflexiva?. Si (a, b) está en R, entonces (b, a) está en R. Para todo elemento a en A, (a, a) pertenece a R. Ningún elemento se relaciona consigo mismo. Si (a, b) y (b, c) están en R, entonces (a, c) está en R. ¿Qué caracteriza a una función?. Los elementos del codominio determinan el dominio. Cada elemento puede tener múltiples imágenes. Solo algunos elementos del dominio tienen imagen. Cada elemento del dominio se asocia con exactamente un elemento del codominio. En lógica proposicional, ¿Qué es una proposición?. Una afirmación que puede ser verdadera o falsa. Una orden o mandato. Una expresión matemática compleja. Una pregunta que requiere respuesta. ¿Cuál es el valor de verdad de la conjunción (p ∧ q) cuando p es verdadero y q es falso?. Indeterminado. Falso. Verdadero. Depende del contexto. ¿Qué es un algoritmo según el curso?. Un proceso infinito de cálculo. Una secuencia finita de instrucciones bien definidas para resolver un problema. Un programa de computadora específico. Una fórmula matemática compleja. ¿Cuál es la notación Big-O para expresar la complejidad computacional?. O👎 No representa el límite superior del tiempo de ejecución. O👎 No representa el espacio de memoria usado. O👎 No representa el tiempo exacto de ejecución. O👎 No representa el límite inferior del tiempo. ¿Qué es el modelado de datos según el curso?. La instalación de bases de datos. La ejecución de consultas SQL. El proceso de crear una representación abstracta de los datos. El análisis estadístico de información. ¿Cuál es el propósito principal de un modelo Entidad-Relación (ER)?. Optimizar el rendimiento de la base de datos. Representar visualmente la estructura de una base de datos. Encriptar la información almacenada. Ejecutar consultas complejas. En el modelo relacional, ¿Qué es una clave primaria?. Una columna que puede tener valores nulos. Un índice secundario de la tabla. Una relación entre dos tablas. Un atributo o conjunto de atributos que identifica unívocamente cada tupla. ¿Qué caracteriza a los datos no estructurados según el curso?. Tienen metadatos completos. Están siempre en formato tabular. No tienen un formato predefinido o esquema fijo. Solo existen en bases de datos relacionales. ¿Cuál es un ejemplo típico de datos no estructurados?. Formularios con campos específicos. Tablas de bases de datos relacionales. Documentos de texto, imágenes y videos. Hojas de cálculo con columnas definidas. ¿Qué es HDFS (Hadoop Distributed File System)?. Un sistema de archivos distribuido diseñado para almacenar grandes volúmenes de datos. Un lenguaje de programación para Big Data. Una base de datos relacional tradicional. Un protocolo de red para transferencia de archivos. ¿Cuál es la función principal de SQL?. Compilar código de programación. Procesar imágenes y videos. Crear interfaces gráficas de usuario. Consultar, manipular y definir datos en bases de datos relacionales. ¿Qué afirmación es correcta sobre la cardinalidad en relaciones del modelo ER?. La cardinalidad no afecta el diseño de la base de datos. La cardinalidad solo se aplica a claves primarias. La cardinalidad define el número de instancias de una entidad que pueden asociarse con instancias de otra. La cardinalidad siempre es 1:1 en todas las relaciones. ¿Cuál es la diferencia principal entre una función inyectiva y una función sobreyectiva?. Una inyectiva permite múltiples imágenes; una sobreyectiva no. Una inyectiva solo funciona con números enteros. No hay diferencia entre ambas. Una función inyectiva asigna elementos distintos del dominio a elementos distintos del codominio; una sobreyectiva cubre todo el codominio. En el contexto de normalización de bases de datos, ¿Qué busca principalmente la Primera Forma Normal (1FN)?. Dividir la tabla en el máximo número posible de subtablas. Eliminar grupos repetitivos y asegurar que cada atributo contenga valores atómicos. Eliminar todas las dependencias funcionales. Crear índices en todas las columnas. ¿Qué ventaja ofrece el procesamiento distribuido en Big Data?. Elimina la necesidad de algoritmos eficientes. Reduce el costo del hardware necesario a cero. Garantiza que nunca habrá fallos en el sistema. Permite procesar grandes volúmenes de datos en paralelo dividiendo el trabajo entre múltiples nodos. En el contexto de extracción de datos, ¿Qué es el ETL?. Encode, Transmit, Log: un protocolo de comunicación. Edit, Test, Launch: un ciclo de desarrollo de software. Evaluate, Train, Learn: un proceso de machine learning. Extract, Transform, Load: un proceso para extraer datos de fuentes, transformarlos y cargarlos en destinos. ¿Qué característica define a una base de datos NoSQL?. Solo funciona con datos numéricos. No utiliza el esquema relacional tradicional y está diseñada para escalabilidad horizontal. No puede almacenar ningún tipo de dato estructurado. Requiere siempre un esquema fijo predefinido. En SQL, ¿Cuál es la diferencia entre INNER JOIN y LEFT JOIN?. LEFT JOIN solo funciona con claves primarias. INNER JOIN es más rápido pero menos preciso que LEFT JOIN. No hay diferencia práctica entre ambos. INNER JOIN retorna solo las filas con coincidencias en ambas tablas; LEFT JOIN retorna todas las filas de la tabla izquierda. ¿Qué es la integración de datos según el curso?. La encriptación de información sensible. La eliminación de datos duplicados. La creación de copias de seguridad. El proceso de combinar datos de diferentes fuentes para proporcionar una vista unificada. En Python, ¿Qué biblioteca es ampliamente utilizada para análisis y manipulación de datos?. OS. Pandas. Tkinter. Socket. ¿Qué representa la complejidad O(n²)?. Un algoritmo logarítmico. Un algoritmo de complejidad lineal. Un algoritmo cuyo tiempo de ejecución crece cuadráticamente con el tamaño de entrada. Un algoritmo de tiempo constante. En el contexto de la calidad de datos, ¿Qué dimensiones se deben considerar según el curso?. Solo la fuente y el destino de los datos. Solo el tamaño y la velocidad de procesamiento. Únicamente el formato y la estructura. Precisión, completitud, consistencia, actualidad y validez. ¿Qué problema fundamental resuelve MapReduce en el procesamiento distribuido?. Permite dividir un problema en tareas map para procesamiento paralelo y luego combinar resultados con reduce. Encripta los datos durante el procesamiento. Convierte datos no estructurados en estructurados automáticamente. Elimina la necesidad de bases de datos. En técnicas de representación de datos, ¿Qué busca la reducción de dimensionalidad?. Reducir el número de variables manteniendo la mayor cantidad de información posible. Eliminar todos los datos menos importantes. Aumentar el número de características para mejor análisis. Convertir todos los datos a formato binario. ¿Qué distingue a un modelo analítico predictivo de uno descriptivo?. El descriptivo es siempre más preciso. No hay diferencia entre ambos tipos. El predictivo solo funciona con datos numéricos. El predictivo anticipa comportamientos futuros basándose en datos históricos; el descriptivo resume patrones en datos existentes. En el ciclo de vida de ML Engineering, ¿Qué fase viene después de la preparación de datos?. Definición del problema. Mantenimiento y monitoreo. Entrenamiento y selección de modelos. Despliegue en producción. ¿Cuál es la diferencia fundamental entre interpretabilidad y explicabilidad en modelos de ML?. Interpretabilidad es entender cómo funciona el modelo internamente; explicabilidad es justificar sus decisiones a usuarios. Interpretabilidad solo se aplica a modelos lineales. Explicabilidad es menos importante que interpretabilidad. Son exactamente lo mismo. En el análisis de costes del proceso analítico, ¿Qué factores se deben considerar?. Únicamente el costo de la electricidad. Costes de infraestructura, procesamiento, almacenamiento, personal y tiempo. Solo el salario del equipo de datos. Solo el precio del software utilizado. ¿Qué técnica de visualización es más apropiada para mostrar la relación entre múltiples variables numéricas?. Matriz de correlación o gráfico de dispersión multivariable. Solo tablas de texto. Diagrama de flujo. Gráfico de barras simple. En el contexto de integración de datos heterogéneos, ¿Qué desafíos principales se presentan y cómo se abordan?. No existen desafíos significativos en la integración. El único problema es el espacio de almacenamiento. Diferencias en esquemas, formatos y semántica; se abordan mediante mapeo de esquemas, transformación de datos y resolución de entidades. Solo hay problemas de velocidad que se resuelven con más hardware. Considerando el balance entre complejidad del modelo y capacidad de generalización, ¿qué estrategias se utilizan para evitar el sobreajuste (overfitting) en modelos de machine learning?. Usar siempre el modelo más complejo disponible. Ignorar las métricas de evaluación. Entrenar solo con datos de prueba. Validación cruzada, regularización, aumento de datos de entrenamiento y selección de características relevantes. |





