SBD04 - Sistemas de Big Data 2026

COMENTARIOS

ESTADÍSTICAS

RÉCORDS

REALIZAR TEST

Título del Test:

SBD04 - Sistemas de Big Data 2026

Descripción:
Test de la unidad 4 de Sistemas de Big Data 2026

Autor:
IAGB

OTROS TESTS DEL AUTOR

Fecha de Creación: 2026/05/28

Categoría: Informática

Número Preguntas: 50

Valoración:

(0)

COMPARTE EL TEST

Nuevo Comentario

Comentarios
NO HAY REGISTROS

Temario:

Los arrays de NumPy: Son multidimensionales y rectangulares. Son monodimensionales. Son multidimensionales sin necesidad de ser rectangulares. Son bidimensionales.

Para importar la librería Pandas en Python usaremos una línea como la siguiente: import pandas as pd. export pandas as pd. load pandas. import pandas.pd.

Uno de los siguientes no es uno de los pasos de CRISP-DM: Modificación de los datos. Comprensión del negocio. Comprensión de los datos. Modelado.

Los DataFrame de Pandas: Son el equivalente a un array bidimensional al que podemos asociar etiquetas tanto para columnas como para filas. Son el equivalente a una lista a la que además se pueden asociar etiquetas. Son multidimensionales. Son monodimensioneles.

El Análisis Diagnóstico: Intenta determinar la causa de un fenómeno que ha ocurrido o está ocurriendo. Por lo general produce como resultado reportes o cuadros de mando estáticos. No emplea estructuras de datos tipo OLAP. Intenta predecir qué ocurrirá en un futuro.

Un diagrama de flujo: Debe tener un único nodo de inicio y al menos uno de final. Debe tener tantos nodos de inicio como de final. Puede tener más de un nodo de inicio. Sólo puede tener un nodo de final.

CRISP-DM es: Una metodología de proceso cíclico ampliamente empleada para el proceso de minería de datos. Una metodología de proceso secuencial ampliamente empleada para el proceso de minería de datos. El acrónimo de una lista de pasos que se emplean en muchas ocasiones a modo de metodología para la minería de datos. Un algoritmo.

El lenguaje Python: Es un lenguaje de programación de alto nivel, interpretado y de propósito general. Es un lenguaje de programación de alto nivel, compilando y de propósito general. Es un lenguaje de programación creado específicamente para facilitar el análisis de datos. Está basado en el lenguaje R.

El Análisis Descriptivo: Por lo general produce como resultado reportes o cuadros de mando estáticos. Por lo general produce como resultado reportes dinámicos. Es análogo al Análisis Disruptivo. Por lo general produce como resultado cuadros de mando dinámicos.

Una de las siguientes no está entre las actividades de la Analítica de Datos: Política de Datos. Obtención/recolección de los datos desde diversas fuentes. Gobierno de Datos. Análisis de Datos.

SEMMA es: El acrónimo de una lista de pasos que se emplean en muchas ocasiones a modo de metodología para la minería de datos. Una metodología para el proceso de minería de datos que goza de una cierta oficialidad al provenir de un proyecto de la Unión Europea. Un proceso de para minería de datos con 6 fases. Un proceso cíclico.

Decimos que para un determinado problema aparece una explosión combinatoria: Cuando el número de posibles soluciones crece muy rápido a medida que aumentamos determinados valores de configuración del propio problema. Cuando el número de posibles soluciones decrece muy rápido a medida que aumentamos determinados valores de configuración del propio problema. Cuando el número de posibles soluciones crece muy rápido a medida que disminuimos determinados valores de configuración del propio problema. Cuando el número de posibles soluciones crece muy rápido a medida que se necesita más memoria para resolver el problema.

Los pasos de SEMMA son: Sample, Explore, Modify, Model, Access. Sample, Explote, Modify, Model, Access. Sample, Explore, Measure, Model, Access. Sample, Explore, Model, Modify, Access.

El pseudocódigo: Está medio camino del lenguaje natural y del lenguaje de programación. Se produce a partir del lenguaje ensamblador. Es un diagrama de flujo. Permite comprobar el valor de las variables en tiempo de ejecución.

Los arrays en R: Son multidimensionales. Son monodimensionales. Son bidimensionales. En R no hay arrays.

Un problema será considerado tratable: Si se puede encontrar un algoritmo capaz de resolverlo en tiempo polinomial. Si se puede encontrar un algoritmo capaz de resolverlo en tiempo exponencial. Si no existe un algoritmo que lo resuelva en tiempo polinomial. Si no existe un algoritmo que lo resuelva en tiempo exponencial.

Matplotlib es: La librería comúnmente utilizada en Python para generar todo tipo de gráficos. La librería de Python que nos ofrece funcionalidad sobre arrays. La librería de R que nos ofrece funcionalidad sobre arrays. Un lenguaje de programación de alto nivel, interpretado y de propósito general.

El Análisis Prescriptivo: Se apoya en los resultados que es capaz de producir el Análisis Predictivo. Se apoya en los resultados que es capaz de producir el Análisis Descriptivo. Por lo general produce como resultado reportes o cuadros de mando estáticos. Intenta determinar la causa de un fenómeno que ha ocurrido o está ocurriendo.

El Análisis Predictivo: Intenta predecir qué ocurrirá en un futuro. Intenta determinar la causa de un fenómeno que ha ocurrido o está ocurriendo. No emplea Machine Learning. Por lo general produce como resultado reportes o cuadros de mando estáticos.

En Python: No necesitamos declarar el tipo de datos de las variables. Debemos declarar el tipo de datos de las variables antes de utilizarlas asignarles valores. Asignamos valores a variables mediante <-. Mostramos valores mediante la función eco.

R es: Un lenguaje de programación interpretado de código abierto creado específicamente para facilitar el análisis de datos. Un lenguaje de programación compilado de código abierto creado específicamente para facilitar el análisis de datos. Un lenguaje de programación de alto nivel, interpretado y propósito general. Un lenguaje de programación interpretado de bajo nivel creado específicamente para facilitar el análisis de datos.

Un algoritmo es: Un conjunto de instrucciones que realizadas en orden permiten solucionar un problema. Cualquier serie de comandos para una computadora. Un conjunto de instrucciones que realizadas en paralelo permiten solucionar un problema. Un conjunto de instrucciones a emplear como base para crear un diagrama de flujo.

Programando en R: Podemos asignar valores a variables usando el operador <-. Podemos asignar valores a variables usando el operador =. Podemos asignar valores a variables usando el operador ->. Es obligatorio declarar el tipo de una variable antes de utilizarla en R.

La Analítica de Datos: Es un concepto amplio que incluye dentro al Análisis de Datos. Está incluída dentro del Análisis de Datos. Es un concepto equivalente al Análisis de Datos. Es equivalente al Gobierno de Datos.

Si queremos saber de cuántos modos distintos podemos ordenar una lista: Estaremos calculando entonces el número de permutaciones. Estaremos calculando entonces el número de variaciones. Estaremos calculando entonces el número de combinaciones. Estaremos calculando entonces el número de nodos.

En un DataFrame de Pandas: Podemos añadir y eliminar columnas una vez está creado. No podemos añadir ni eliminar columnas una vez está creado. Podemos añadir columnas pero no eliminarlas una vez está creado. No podemos añadir columnas pero sí eliminarlas una vez está creado.

Si trabajamos con R: Contamos con gran cantidad de conjuntos de datos dentro de paquetes a los cuales podemos acceder si están instalados. Cargamos siempre los datos desde fichero con la función load_data. No es necesario instalar ningún paquete porque todo está incluído. Realizamos visualización de datos mediante la librería Matplotlib.

Los Dataframes de R: Pueden almacenar distintos tipos de datos. Son multidimensionales. Son equivalentes a los arrays pero permitiendo distintos tipos de datos. Son equivalentes a las listas pero permitiendo distintos tipos de datos.

Matplotlib permite: CorrectaCrear distintos tipos de gráficos, como de línea, de puntos o de barras. Ejecutar un algoritmo en tiempo real. Crear gráficos de barras. Crear distintos tipos de gráficos, como de línea o de puntos.

¿Cuál de las siguientes afirmaciones es cierta en relación a los diagramas de flujo?. Pueden tener cualquier número de nodos de inicio. Deben tener un único nodo de final. Deben tener un único nodo de inicio y al menos uno de final. No tienen nodo de inicio y deben tener uno o más nodos de final.

Si queremos saber de cuántos modos distintos podemos tomar N elementos de un conjunto de M y ordenar esos N, estaremos calculando entonces el número de permutaciones. Verdadero. Falso.

Si queremos saber de cuántos modos distintos podemos tomar N elementos de un conjunto de M, estaremos calculando entonces el número de variaciones. Verdadero. Falso.

Si queremos saber de cuántos modos distintos podemos ordenar una lista, estaremos calculando entonces el número de permutaciones. Verdadero. Falso.

¿Cuál de las siguientes afirmaciones es correcta respecto del la complejidad de algoritmos?. Un algoritmo de tiempo polinomial siempre emplea menos tiempo en resolver un problema que uno exponencial. Un algoritmo de tiempo exponencial siempre emplea menos tiempo en resolver un problema que uno polinomial. Un algoritmo de tiempo exponencial siempre termina siendo más rápido que uno de tiempo polinomial si el tamaño de la entrada es lo suficientemente grande. Un algoritmo de tiempo polinomial siempre termina siendo más rápido que uno de tiempo exponencial si el tamaño de la entrada es lo suficientemente grande.

La Analítica de Datos está contenida dentro del Análisis de Datos. Verdadero. Falso.

La limpieza de datos es una de las actividades de la Analítica de Datos. Verdadero. Falso.

El Gobierno de Datos es una de las actividades del Análisis de Datos. Verdadero. Falso.

¿Podemos en R operar un vector con un número?. Verdadero. Falso.

¿Usaremos el operador <= para asignar valores a una variable?. Verdadero. Falso.

¿Podemos asignar nombres a los elementos de un vector?. Verdadero. Falso.

¿Cuál de las siguientes afirmaciones es correcta respecto de arrays y matrices en R?. Son de dimensiones equivalentes. Las matrices son bidimensioneles mientras que los arrays pueden tener hasta 3 dimensiones. Las matrices son bidimensioneles mientras que los arrays pueden tener cualquier número de dimensiones. Los arrays son bidimensioneles mientras que las matrices pueden tener cualquier número de dimensiones.

¿Cuál de las siguientes afirmaciones es correcta en relación a listas y dataframes en R?. Las listas son unidimensionales y los dataframes bidimensionales. Los dataframes son bidimensionales, con celdas de cualquier tipo sin restricción. Las listas son unidimensionales y los dataframes pueden tener cualquier dimensión. Los dataframes tienen dos dimensiones más que las listas.

¿Para escribir valores por pantalla con Python usaremos la función eco?. Verdadero. Falso.

¿Podemos añadir comentarios usando el caracter especial $?. Verdadero. Falso.

¿Las listas en Python pueden contener dentro otras listas hasta cualquier nivel de anidación?. Verdadero. Falso.

¿Con NumPy podemos crear arrays a partir de listas?. Verdadero. Falso.

¿Para acceder a un array de NumPy usaremos la sintaxis x[inicio:paso:final], suponiendo que x es un array?. Verdadero. Falso.

¿Cuáles de las siguientes afirmaciones es cierta en relación a los DataFrames de Pandas?. Podemos añadir columnas con add y eliminarlas con del. No podemos añadir columnas una vez creado el DataFrame. Podemos añadir columnas accediendo al array mediante el nombre que tendrá la nueva columna, o eliminar columnas utilizando del. Podemos añadir columnas pero no eliminarlas.

¿Cuáles de las siguientes afirmaciones son correctas respecto de Matplotlib?. Sólo puede emplearse con arrays de NumPy. Puede emplearse con DataFrames y Series de Pandas. Puede crear diversos tipos de gráficos, entre ellos los de línea, de puntos o de barra. Sólo puede dibujar un gráfico a la vez.

Denunciar Test