ESTADISTICA
![]() |
![]() |
![]() |
Título del Test:![]() ESTADISTICA Descripción: CIENCIA DE DATOS |




Comentarios |
---|
NO HAY REGISTROS |
¿Cuál es una medida de tendencia central?. Varianza. Mediana. Rango. Desviación estándar. ¿Qué distribución de probabilidad es adecuada para describir el número de éxitos en una serie de ensayos independientes?. Normal. Binomial. Uniforme. Exponencial. ¿Qué tipo de modelo de regresión es mejor para predecir una variable dependiente binaria?. Lineal. Logística. Polinomial. Ridge. ¿Qué librería de Python es más utilizada para visualización de datos?. pandas. scipy. matplotlib. tensorflow. ¿Qué declaración SQL es utilizada para seleccionar datos de una base de datos?. SELECT. INSERT. UPDATE. DELETE. ¿Cuál es el propósito principal del análisis factorial en estadística?. Predecir valores de una variable dependiente. Reducir la dimensionalidad de los datos. Estimar la varianza de los datos. Probar la independencia de dos variables. ¿Qué método de clustering asigna cada observación al cluster con la media más cercana?. K-medias. Análisis jerárquico. DBSCAN. Clustering espectral. ¿Qué distribución se utiliza comúnmente para modelar tiempos de espera entre eventos en un proceso de Poisson?. Normal. Binomial. Exponencial. Uniforme. ¿Qué indica un coeficiente positivo en un modelo de regresión logística?. Disminución en la probabilidad del evento. Aumento en la probabilidad del evento. No hay cambio en la probabilidad del evento. El modelo es inválido. ¿Cuál es la función de la cláusula "WHERE" en SQL?. Ordenar los resultados. Unir tablas. Filtrar registros. Agrupar registros. ¿Qué técnica de regresión se utiliza para controlar la multicolinealidad?. Regresión lineal simple. Regresión Ridge. Regresión logística. Regresión polinomial. ¿Qué método se utiliza para obtener el número de elementos en un diccionario?. len(). size(). count(). length(). ¿Cuál es un componente esencial de la arquitectura de Big Data?. TensorFlow. Hadoop. ggplot2. MySQL. ¿Qué representa el "prior" en un modelo Bayesiano?. La probabilidad de los datos observados. La creencia previa sobre un parámetro. El resultado del modelo. Una prueba estadística. ¿Qué supuesto no es necesario para la regresión lineal?. Homocedasticidad. Independencia de las observaciones. Normalidad de los errores. Las variables predictoras deben ser categóricas. ¿Qué algoritmo es un ejemplo de aprendizaje supervisado?. K-medias. Árboles de decisión. Análisis de componentes principales (PCA). Algoritmo de Louvain. ¿Qué librería de Python es esencial para manipulación de datos?. Pandas. Matplotlib. Scikit-learn. PyTorch. ¿Qué técnica es utilizada para explorar la relación entre múltiples variables categóricas?. Análisis de varianza (ANOVA). Regresión lineal. Análisis de correspondencias. Análisis discriminante lineal. ¿Qué cláusula SQL se utiliza para agrupar filas que tienen los mismos valores en columnas especificadas?. GROUP BY. JOIN. ORDER BY. SELECT. ¿Cuál es un método de ensamble en machine learning?. Regresión logística. Redes neuronales. Boosting. SVM (Máquinas de Vectores de Soporte). ¿Qué herramienta es ampliamente utilizada para crear visualizaciones interactivas en la web?. ggplot2. Matplotlib. Plotly. Seaborn. ¿Qué tipo de base de datos NoSQL es adecuada para almacenar relaciones entre entidades como redes sociales?. Key-Value. Document. Wide-Column. Graph. ¿Qué técnica se usa comúnmente para reducir la dimensionalidad de los datos manteniendo la mayor varianza posible?. Regresión logística. Análisis de componentes principales (PCA). K-medias. Análisis discriminante lineal. ¿Cuál de los siguientes es un método utilizado para estimar parámetros de población?. Prueba de chi-cuadrado. Correlación de Pearson. Estimación por intervalos. Análisis de conglomerados. ¿Qué función en R se utiliza para aplicar una operación a cada elemento de una lista o vector?. apply. lapply. sapply. tapply. ¿Qué técnica de Machine Learning es efectiva para tratar con datos no etiquetados?. Regresión logística. Clustering. Regresión lineal. Árboles de decisión. ¿Qué tipo de base de datos es mejor para manejar grandes volúmenes de datos con estructura variable?. Relacional. Documento. Gráfico. Clave-valor. ¿Qué método multivariado es usado comúnmente para identificar patrones subyacentes en los datos?. Regresión lineal múltiple. Análisis factorial. ANOVA. Correlación de Spearman. ¿Qué librería de Python es ampliamente utilizada para crear visualizaciones estadísticas avanzadas?. Pandas. Seaborn. NumPy. SciPy. ¿Qué método se utiliza para mejorar la predicción de modelos de regresión reduciendo la complejidad del modelo?. Regresión Lasso. Regresión lineal. Regresión polinomial. Clustering. ¿Qué cláusula SQL se utiliza para devolver solo filas únicas?. DISTINCT. UNIQUE. SINGLE. DIFFERENT. ¿Qué componente de Hadoop permite el procesamiento paralelo de grandes datos?. HBase. Hive. MapReduce. ZooKeeper. ¿Cuál es el principal beneficio de usar la regresión Ridge en el análisis de regresión?. Aumenta la precisión de las predicciones al ajustar modelos no lineales. Reduce la multicolinealidad entre predictores al introducir un término de penalización. Facilita el manejo de grandes conjuntos de datos. Elimina la necesidad de seleccionar variables. ¿Qué algoritmo de clustering es especialmente efectivo para identificar grupos con formas no esféricas?. K-medias. Clustering jerárquico. DBSCAN. Análisis de componentes principales. ¿Cuál es una técnica común para evitar el sobreajuste en modelos de machine learning?. Incrementar el tamaño del conjunto de datos de entrenamiento. Reducir el número de características. Usar un modelo más complejo. Incrementar el parámetro de regularización. ¿Qué comando SQL se utiliza para actualizar datos en una tabla?. UPDATE. MODIFY. CHANGE. ALTER. ¿Qué paquete en R es ampliamente usado para crear visualizaciones interactivas?. ggplot2. lattice. shiny. plotly. ¿Qué técnica de aprendizaje no supervisado es útil para reducir la dimensionalidad de los datos antes de realizar clustering?. PCA (Análisis de Componentes Principales). Regresión logística. Árboles de decisión. SVM (Máquinas de Vectores de Soporte). ¿Qué tipo de base de datos NoSQL es óptima para manejar grandes cantidades de datos con una estructura simple de clave-valor?. Documento. Gráfico. Columnar. Clave-valor. ¿Qué término en estadística Bayesiana representa la probabilidad actualizada de un parámetro después de observar los datos?. Prior. Likelihood. Posterior. Marginal. ¿Qué librería de Python proporciona herramientas para la creación de modelos de Machine Learning?. NumPy. Pandas. Scikit-learn. Matplotlib. ¿Qué técnica se utiliza comúnmente para estimar el efecto causal de una intervención?. Regresión lineal. Prueba T. Modelos de efectos fijos. ANOVA. ¿Qué distribución de probabilidad es típicamente usada para modelar el número de veces que ocurre un evento en un intervalo fijo de tiempo o espacio?. Normal. Poisson. Binomial. Exponencial. ¿Qué librería de R proporciona una sintaxis consistente para construir gráficos complejos?. lattice. ggplot2. base. shiny. ¿Cuál de los siguientes algoritmos es un método de ensamble en machine learning?. K-medias. Regresión logística. Random Forest. PCA. ¿Qué cláusula SQL se utiliza para combinar filas de dos o más tablas basándose en una columna relacionada entre ellas?. JOIN. UNION. INTERSECT. LINK. ¿Qué tipo de base de datos NoSQL es mejor para analizar grandes volúmenes de datos distribuidos en varios servidores?. Documento. Columnar. Clave-valor. Gráfico. ¿Qué método estadístico se utiliza para determinar si tres o más medias son estadísticamente diferentes?. T-test. ANOVA. Regresión lineal. Correlación. ¿Qué técnica se utiliza para identificar la estructura subyacente o patrones en un conjunto de datos sin etiquetar?. Clustering. Regresión logística. Análisis discriminante. Supervised learning. ¿Qué estructura de datos de Python es mejor para almacenar elementos únicos?. Lista. Tupla. Diccionario. Conjunto. ¿Qué técnica se utiliza comúnmente para explorar las relaciones entre múltiples variables categóricas y cuantitativas?. Correlación de Spearman. Regresión logística. Análisis de correspondencia múltiple?. ANOVA de dos vías. ¿Qué herramienta se utiliza para crear visualizaciones interactivas en la web usando Python?. Matplotlib. Seaborn. Bokeh. ggplot2. ¿Qué objetivo tiene la regresión logística en el análisis de datos?. Predecir un valor numérico continuo. Clasificar datos en categorías predeterminadas. Describir la relación entre variables numéricas. Agrupar datos similares en conjuntos. ¿Qué operación SQL se usa para retornar solo una parte de los registros?. SELECT DISTINCT. SELECT TOP. SELECT MAX. SELECT COUNT. ¿Qué característica principal tienen las bases de datos documentales?. Almacenamiento de datos en forma de grafos. Uso de estructuras de clave-valor. Almacenamiento de datos en documentos, típicamente en formato JSON o XML. Estructuración de datos en tablas rígidas. ¿Cuál es un método popular para reducción de dimensionalidad además de PCA?. Regresión logística. Análisis de correspondencia. t-SNE. k-NN (k-Nearest Neighbors). ¿Qué método de clustering se basa en el concepto de densidad para formar grupos?. K-medias. DBSCAN. Análisis jerárquico. Regresión lineal. ¿Qué método se utiliza comúnmente para evaluar la precisión de un modelo de clasificación?. R-cuadrado. ANOVA. Matriz de confusión. Correlación de Pearson. ¿Qué test estadístico se utiliza para comparar las medias de dos grupos independientes?. t-test para muestras independientes.. Chi-cuadrado. t-test para muestras relacionadas. Análisis de varianza (ANOVA). ¿Cuál es una ventaja principal de las bases de datos de clave-valor?. Soporte para transacciones complejas. Alta escalabilidad y rendimiento en operaciones de lectura y escritura. Estructuración robusta de datos. Excelente soporte para consultas analíticas. ¿Cuál herramienta de Python se recomienda para realizar visualizaciones interactivas complejas?. Matplotlib. Seaborn. Bokeh. Pandas. ¿Qué comando SQL se utiliza para eliminar filas de una tabla?. DELETE. REMOVE. DROP. TRUNCATE. ¿Qué técnica de visualización es ideal para comparar partes de un todo en diferentes categorías?. Histograma. Diagrama de dispersión. Gráfico de barras. Gráfico circular. ¿Qué método estadístico se utiliza para probar si hay una diferencia significativa entre las medias de tres o más grupos?. t-test. Chi-cuadrado. ANOVA. Correlación. ¿Qué paquete de R es ampliamente utilizado para análisis estadístico avanzado?. ggplot2. dplyr. shiny. lmtest. ¿Qué tecnología es esencial para procesar grandes conjuntos de datos en tiempo real?. MongoDB. Hadoop. Apache Spark. MySQL. ¿Qué algoritmo es mejor para detectar las relaciones no lineales entre características y etiquetas?. Regresión lineal. Árboles de decisión. Regresión logística. Análisis discriminante lineal. ¿Qué cláusula SQL se usa para filtrar resultados después de un agrupamiento?. WHERE. HAVING. GROUP BY. ORDER BY. ¿Qué tipo de modelo de base de datos es mejor para gestionar datos con relaciones complejas?. Clave-valor. Documento. Gráfico. Columnar. ¿Qué técnica se utiliza para examinar la relación entre varias variables cuantitativas?. Análisis de correspondencias. Regresión logística. Análisis de componentes principales (PCA). Chi-cuadrado. ¿Qué métrica se utiliza comúnmente para evaluar modelos de regresión?. Precisión. R-cuadrado. Recall. F1-Score. ¿Qué técnica de validación es utilizada para evaluar el rendimiento de un modelo de machine learning?. Prueba T. Validación cruzada. ANOVA. Correlación. ¿Cuál es la función de la distribución exponencial en estadística?. Modelar el número de eventos que suceden en un intervalo de tiempo. Describir el tiempo entre eventos en un proceso de Poisson. Representar la probabilidad de éxito en ensayos repetidos. Calcular el promedio de una serie de observaciones. ¿Qué tipo de gráfico es más adecuado para visualizar la relación entre dos variables continuas?. Gráfico de barras. Histograma. Diagrama de dispersión. Gráfico de líneas. ¿Qué cláusula SQL se utiliza para ordenar los resultados de una consulta?. ORDER BY. GROUP BY. SORT BY. ALIGN BY. ¿Qué método de machine learning es utilizado para agrupar objetos similares en diferentes grupos?. Regresión logística. Clustering. Análisis discriminante. Regresión lineal. ¿Qué prueba se utiliza para determinar si dos muestras independientes provienen de distribuciones idénticas?. Prueba T de Student. Prueba de Kolmogorov-Smirnov. ANOVA. Prueba Chi-cuadrado. ¿Qué tipo de base de datos es adecuada para manejar consultas que involucran relaciones complejas, especialmente en redes sociales?. Bases de datos relacionales. Bases de datos de grafos. Bases de datos clave-valor. Bases de datos de documentos. ¿Qué técnica de análisis multivariante es utilizada para describir la varianza y covarianza entre muchas variables cuantitativas?. Análisis de correspondencias. Análisis de clusters. Análisis factorial. Regresión múltiple. ¿Qué estructura de datos en Python es mejor conocida por su capacidad de almacenar elementos ordenados y que no pueden ser modificados?. Listas. Diccionarios. Conjuntos. Tuplas. ¿Qué biblioteca de Python es preferida para la visualización de datos estadísticos complejos, facilitando la creación de gráficos sofisticados?. Matplotlib. Seaborn. Plotly. Pandas. ¿Qué framework es ampliamente utilizado para el procesamiento de datos a gran escala en aplicaciones de machine learning?. Apache Hadoop. Apache Spark. TensorFlow. Scikit-learn. ¿Qué medida es usada para estimar la dispersión de un conjunto de datos?. Media. Mediana. Moda. Desviación estándar. ¿Qué estructura de datos en Python es mejor para operaciones de inclusión y eliminación rápidas?. Lista. Diccionario. Conjunto. Deque. ¿Cuál es una suposición clave de la regresión lineal?. Las variables predictoras son independientes entre sí. La variable dependiente es categórica. Las variables predictoras deben ser no lineales. La relación entre variables es curvilínea. ¿Qué cláusula SQL se usa para eliminar duplicados de los resultados de una consulta?. REMOVE. UNIQUE. DISTINCT. SINGLE. ¿Qué técnica de machine learning es adecuada para hacer predicciones sobre datos no etiquetados?. Clasificación supervisada. Regresión supervisada. Clustering. Refuerzo. ¿Qué caracteriza a las bases de datos NoSQL en comparación con las bases de datos relacionales?. Estricta adhesión a esquemas. Operaciones transaccionales complejas. Flexibilidad en esquemas de datos. Menor escalabilidad. ¿Qué herramienta de visualización es efectiva para crear mapas interactivos y visualizaciones geográficas?. ggplot2. Matplotlib. Leaflet. Seaborn. ¿Para qué se utiliza principalmente el análisis factorial en estadísticas?. Comparar medias de múltiples grupos-. Identificar relaciones lineales entre variables. Reducir la dimensionalidad de los datos. Clasificar datos en categorías predeterminadas. ¿Qué indica un valor alto de R-cuadrado en un modelo de regresión?. Alta variabilidad de los predictores. Baja correlación entre variables. Buen ajuste del modelo a los datos. Alta probabilidad de sobreajuste. ¿Qué comando SQL se utiliza para agregar una nueva columna a una tabla existente?. ADD COLUMN. UPDATE. ALTER TABLE. MODIFY TABLE. ¿Qué comando SQL se usa para eliminar una tabla existente?. DROP TABLE. DELETE TABLE. REMOVE TABLE. CLEAR TABLE. ¿Qué test estadístico se utiliza para evaluar la independencia de dos variables categóricas?. ANOVA. Regresión lineal. Prueba Chi-cuadrado. Prueba T. ¿Qué técnica de machine learning se utiliza principalmente para la reducción de la dimensionalidad?. Clustering. Regresión logística. Redes neuronales. Análisis de componentes principales (PCA). ¿Qué función en R se utiliza para aplicar una función a filas o columnas de una matriz?. lapply(). apply(). sapply(). tapply(). ¿Cuál es la distribución adecuada para modelar el número de éxitos en una secuencia de ensayos independientes?. Normal. Binomial. Poisson. Exponencial. ¿Qué herramienta de Python es preferida para realizar visualizaciones dinámicas e interactivas?. Matplotlib. Seaborn. Plotly. ggplot2. ¿Qué cláusula SQL se utiliza para devolver solo filas únicas de una consulta?. SELECT DISTINCT. GROUP BY. UNIQUE. DISTINCTIVE. ¿Cuál es una medida de tendencia central?. Rango. Mediana. Varianza. Desviación estándar. ¿Qué framework de Java es utilizado para procesar grandes volúmenes de datos en un entorno distribuido?. Apache Hadoop. Apache Spark. Apache Kafka. Apache Cassandra. ¿Qué librería de Python es fundamental para el análisis de datos debido a sus estructuras de datos y herramientas de manipulación?. NumPy. SciPy. Pandas. Matplotlib. ¿Qué tipo de análisis estadístico se utiliza para determinar si existe una relación significativa entre dos variables continuas?. ANOVA. Regresión lineal. Chi-cuadrado. Prueba T de Student. ¿Qué herramienta de visualización es ideal para explorar la relación entre múltiples variables continuas?. Diagrama de barras. Matriz de correlación. Gráfico circular. Histograma. ¿Qué declaración SQL se utiliza para seleccionar datos específicos de una base de datos?. INSERT. UPDATE. SELECT. DELETE. ¿Qué técnica de machine learning es utilizada para predecir variables categóricas?. Regresión lineal. Clustering. Clasificación. Reducción de dimensionalidad. ¿Qué distribución de probabilidad es ideal para modelar el número de éxitos en una secuencia de ensayos Bernoulli?. Normal. Binomial. Poisson. Exponencial. ¿Qué tipo de base de datos NoSQL es adecuada para almacenar y manejar datos jerárquicos?. Bases de datos de clave-valor. Bases de datos documentales. Bases de datos de grafos. Bases de datos columnares. ¿Qué técnica se utiliza para analizar la variabilidad entre grupos de múltiples variables?. Análisis de regresión. Análisis de varianza multivariante (MANOVA). Análisis factorial. Clustering. ¿Qué estructura de datos en Python es mejor conocida por su eficiencia en operaciones de acceso, inserción y eliminación rápidas?. Listas. Diccionarios. Tuplas. Conjuntos. ¿Qué biblioteca de Python se utiliza para crear gráficos interactivos complejos en la web?. Matplotlib. Seaborn. Bokeh. Plotly. ¿Qué cláusula SQL se utiliza para combinar resultados de dos o más consultas asegurando que no haya filas duplicadas?. JOIN. UNION DISTINCT. UNION ALL. MERGE. ¿Qué tipo de base de datos es óptima para relaciones altamente conectadas, como redes sociales?. Bases de datos relacionales. Bases de datos de documentos. Bases de datos de grafos. Bases de datos clave-valor. ¿Qué método estadístico se utiliza para determinar si existe una correlación entre dos variables continuas?. Chi-cuadrado. ANOVA. Regresión lineal. Coeficiente de correlación de Pearson. ¿Qué estructura de datos en Python es más eficiente para operaciones de búsqueda rápida y no permite duplicados?. Lista. Diccionario. Conjunto. Tupla. ¿Qué técnica de aprendizaje automático es útil para descubrir grupos ocultos en datos sin etiquetar?. Clasificación supervisada. Regresión lineal. Clustering. Refuerzo. ¿Qué tipo de gráfico es mejor para mostrar la distribución de una variable continua?. Gráfico de barras. Diagrama de caja. Histograma. Gráfico de líneas. ¿Qué comando SQL se utiliza para cambiar el esquema de una base de datos existente añadiendo una columna nueva?. UPDATE TABLE. ALTER TABLE. MODIFY TABLE. CHANGE TABLE. ¿Qué distribución se utiliza para modelar eventos raros distribuidos en un intervalo de tiempo?. Binomial. Normal. Exponencial. Poisson. ¿Qué característica distingue a las bases de datos de grafos de otros tipos de bases de datos NoSQL?. Almacenamiento de datos en pares clave-valor. Optimización para consultas complejas entre relaciones. Almacenamiento de datos en documentos. Utilización de columnas para almacenar datos. ¿Qué librería de Python es esencial para el manejo de datos en forma de tablas y realizar operaciones de manipulación de datos?. NumPy. Pandas. Matplotlib. SciPy. ¿Qué herramienta de visualización permite crear visualizaciones interactivas y complejas en la web utilizando Python?. Seaborn. ggplot2. Plotly. Bokeh. ¿Qué declaración SQL se utiliza para agregar datos a una tabla?. INSERT INTO. ADD TO. UPDATE. ATTACH. ¿Qué medida estadística proporciona el valor que divide al conjunto de datos en dos mitades iguales?. Media. Moda. Mediana. Rango. ¿Qué técnica de machine learning se utiliza para predecir una variable dependiente continua?. Clustering. Regresión. Clasificación. Refuerzo. ¿Qué gráfico es el más adecuado para mostrar la relación entre dos variables categóricas?. Diagrama de dispersión. Gráfico de barras. Gráfico de líneas. Tabla de contingencia. ¿Qué tipo de base de datos NoSQL es especialmente útil para aplicaciones que requieren escalabilidad horizontal?. Relacionales. Documentales. De grafos. Clave-valor. ¿Qué distribución es utilizada para modelar el tiempo entre eventos en un proceso estocástico?. Binomial. Normal. Exponencial. Poisson. ¿Qué estructura de control en programación se utiliza para repetir un bloque de instrucciones un número conocido de veces?. if-else. while. for. switch. ¿Qué técnica se utiliza para explorar la relación entre múltiples variables categóricas?. Análisis de regresión. Análisis factorial. Análisis de correspondencias. ANOVA multivariante. ¿Qué comando SQL se utiliza para cambiar el nombre de una columna en una tabla?. RENAME COLUMN. ALTER TABLE. MODIFY COLUMN. UPDATE TABLE. ¿Qué es un modelo en aprendizaje automático?. Una función que predice la etiqueta de una instancia a partir de sus características. Un algoritmo que aprende de los datos de forma automática. Una medida que evalúa la calidad de la predicción. Un tipo de estructura de datos usada para almacenar los datos de entrenamiento. ¿Qué cláusula SQL se usa para eliminar filas específicas de una tabla?. DROP. DELETE. TRUNCATE. REMOVE. ¿Qué test estadístico es apropiado para comparar las medias de dos grupos independientes cuando los datos no siguen una distribución normal?. Prueba t de Student. Prueba de Mann-Whitney U. ANOVA. Chi-cuadrado. ¿Cuál es la herramienta ideal para crear visualizaciones interactivas de datos en Python?. Matplotlib. Seaborn. Bokeh. Plotly. ¿Qué caracteriza principalmente a las bases de datos de grafos?. Almacenamiento de datos en pares clave-valor. Optimización para relaciones altamente conectadas. Estructuración de datos en documentos JSON. Uso de columnas para almacenar datos. ¿Qué función de R se utiliza comúnmente para cargar datos externos desde un archivo CSV?. read.csv(). load(). attach(). read.table(). ¿Qué algoritmo es un ejemplo de aprendizaje supervisado?. K-medias. Árboles de decisión. Análisis principal de componentes (PCA). DBSCAN. ¿Qué representa el "valor p" en un test estadístico?. La probabilidad de que los resultados sean replicables. La probabilidad de observar un efecto igual o más extremo que el efecto observado bajo la suposición de que la hipótesis nula es cierta. La probabilidad de que la hipótesis nula sea falsa. La significancia estadística del efecto observado. ¿Qué cláusula SQL se utiliza para combinar las filas de dos o más tablas basadas en una columna relacionada entre ellas?. JOIN. UNION. LINK. MERGE. ¿Qué método se utiliza para identificar la existencia de grupos dentro de un conjunto de datos?. Análisis discriminante. Regresión lineal. Clustering. Correlación. ¿Qué tipo de gráfico es más efectivo para mostrar cambios en el tiempo?. Gráfico de barras. Gráfico de líneas. Gráfico de pastel. Histograma. ¿Qué estadístico se utiliza para medir la dispersión de un conjunto de datos alrededor de su media?. Media. Mediana. Moda. Desviación estándar. ¿Qué cláusula SQL se utiliza para limitar las filas retornadas por una consulta según condiciones específicas?. WHERE. LIMIT. HAVING. ORDER BY. ¿Qué función de Python convierte un número a un string?. int(). float(). str(). list(). ¿Cuál es un ejemplo de un modelo de machine learning no supervisado?. Regresión logística. Árboles de decisión. K-medias. Redes neuronales supervisadas. ¿Qué gráfico es más adecuado para visualizar la relación entre dos variables cuantitativas?. Gráfico de pastel. Histograma. Gráfico de barras. Diagrama de dispersión. ¿Qué análisis se utiliza para reducir la dimensionalidad mientras se maximiza la varianza?. Análisis de cluster. Análisis de componentes principales (PCA). Análisis discriminante lineal. Regresión múltiple. ¿Qué distribución es conocida por modelar fenómenos naturales como la altura o el peso?. Binomial. Poisson. Normal. Exponencial. ¿Qué tecnología es fundamental para el procesamiento de grandes cantidades de datos en tiempo real?. Hadoop. MongoDB. Apache Kafka. Redis. ¿Qué métrica se utiliza comúnmente para evaluar modelos de clasificación?. R-cuadrado. Precisión. Correlación. Error cuadrático medio. ¿Qué cláusula SQL se utiliza para agrupar los resultados de una consulta por una o más columnas?. GROUP BY. PARTITION BY. ORDER BY. CLUSTER BY. ¿Qué test estadístico se usa comúnmente para comparar las medias de dos grupos independientes?. Prueba de Mann-Whitney. ANOVA. Prueba t. Prueba de Wilcoxon. ¿Qué función se utiliza para leer un archivo CSV en Python utilizando pandas?. pandas.open_csv(). pandas.read(). pandas.read_csv(). pandas.load_csv(). ¿Qué gráfico es ideal para mostrar la distribución de una variable continua?. Gráfico de líneas. Gráfico de barras. Histograma. Gráfico de pastel. ¿Qué tipo de base de datos es mejor para manejar relaciones complejas entre grandes volúmenes de datos?. Bases de datos de documentos. Bases de datos de grafos. Bases de datos clave-valor. Bases de datos relacionales. ¿Qué análisis se utiliza para entender las relaciones entre varias variables categóricas?. Análisis de regresión múltiple. Análisis factorial. Análisis de varianza (ANOVA). Análisis de correspondencias. ¿Qué método de aprendizaje automático se utiliza para categorizar un conjunto de datos en grupos no etiquetados?. Clasificación supervisada. Regresión. Clustering. Refuerzo. ¿Qué comando SQL se usa para añadir una restricción a una tabla existente?. ADD CONSTRAINT. ALTER TABLE. UPDATE TABLE. SET CONSTRAINT. ¿Qué representa una variable aleatoria en probabilidad?. Un evento con resultado incierto. La función que asigna un número a cada resultado de un experimento. El resultado de un experimento determinístico. Una distribución de probabilidad conocida. ¿Qué técnica es fundamental para el preprocesamiento de datos antes de aplicar un modelo de machine learning?. Normalización. Análisis de componentes principales. Codificación de variables. Todas las anteriores. ¿Qué función en R se utiliza comúnmente para generar modelos lineales?. lm(). glm(). lmer(). aov(). ¿Cuál es una técnica adecuada para analizar la relación entre variables categóricas?. Análisis de regresión. ANOVA. Análisis de correspondencias. Coeficiente de correlación de Pearson. ¿Qué método de lista en Python se utiliza para añadir un elemento al final de la lista?. append(). extend(). insert(). add(). ¿Qué tipo de gráfico es más adecuado para analizar la relación temporal entre dos variables continuas?. Gráfico de barras. Gráfico de líneas. Histograma. Diagrama de dispersión. ¿Qué declaración SQL se utiliza para eliminar todas las filas de una tabla sin eliminar la tabla misma?. DELETE FROM. DROP TABLE. TRUNCATE TABLE. REMOVE ALL. ¿Qué tipo de base de datos es mejor para transacciones rápidas que implican grandes volúmenes de datos?. Bases de datos de documentos. Bases de datos de grafos. Bases de datos clave-valor. Bases de datos relacionales. ¿Qué técnica se utiliza para determinar si diferentes grupos tienen medias similares en más de dos variables?. ANOVA multivariante (MANOVA). Análisis de regresión. Análisis factorial. Prueba t. ¿Qué técnica de machine learning es utilizada comúnmente para predecir valores continuos?. Clustering. Regresión. Clasificación. Reducción de dimensionalidad. ¿Qué comando SQL se utiliza para agregar una columna nueva a una tabla existente?. UPDATE TABLE. ALTER TABLE. ADD COLUMN. MODIFY TABLE. ¿Qué distribución se utiliza comúnmente para modelar el número de éxitos en una serie de ensayos independientes con dos posibles resultados?. Normal. Binomial. Poisson. Exponencial. ¿Qué técnica se usa para evaluar la importancia de las variables en un modelo de regresión?. Coeficiente de determinación (R-cuadrado). Análisis de la varianza (ANOVA). Importancia de la característica (Feature importance). Correlación de Pearson. ¿Qué medida de tendencia central es más resistente a los valores atípicos?. Media. Mediana. Moda. Desviación estándar. ¿Qué tipo de datos se utiliza para almacenar múltiples elementos en Python, que pueden ser modificados y son ordenados?. Tuplas. Diccionarios. Conjuntos. Listas. ¿Qué tipo de gráfico es efectivo para comparar partes de un todo en distintas categorías?. Diagrama de dispersión. Histograma. Gráfico de barras. Gráfico circular. ¿Qué comando SQL se utiliza para cambiar el nombre de una tabla?. RENAME TABLE. ALTER TABLE RENAME TO. CHANGE TABLE NAME. UPDATE TABLE NAME. ¿Qué algoritmo de clustering es especialmente efectivo para identificar grupos basados en densidad de puntos?. K-medias. Clustering jerárquico. DBSCAN. Análisis de componentes principales. ¿Qué métrica se usa para medir cuán bien un modelo de regresión lineal ajusta los datos?. Precisión. Recall. R-cuadrado. AUC. ¿Qué cláusula SQL se utiliza para seleccionar filas únicas de una tabla sin importar el orden?. SELECT UNIQUE. SELECT DISTINCT. SELECT ONLY. SELECT DIFFERENT. ¿Qué librería de Python proporciona estructuras de datos para manejar datos de manera eficiente en ciencia de datos?. NumPy. Matplotlib. Pandas. Scikit-learn. ¿Qué representa una variable aleatoria en términos de probabilidad?. Una función que asigna un número a cada posible resultado de un experimento. Un tipo específico de distribución de probabilidad. Un evento cuyo resultado es incierto. Una hipótesis sobre el resultado de un experimento. ¿Qué herramienta es utilizada para crear visualizaciones interactivas complejas en la web usando Python?. Matplotlib. Seaborn. Plotly. ggplot. ¿Qué test estadístico se utiliza para determinar si dos muestras independientes provienen de la misma distribución?. Prueba t de Student. ANOVA. Prueba de Mann-Whitney. Chi-cuadrado. ¿Qué método se utiliza para eliminar un elemento específico de una lista por su valor?. remove(). pop(). delete(). discard(). ¿Qué gráfico es más adecuado para comparar cantidades entre varias categorías?. Histograma. Gráfico de barras. Gráfico de líneas. Gráfico de pastel. ¿Qué cláusula SQL se utiliza para actualizar datos en una tabla?. MODIFY. ALTER. UPDATE. CHANGE. ¿Cuál es una técnica comúnmente utilizada para evitar el sobreajuste en un modelo de machine learning?. Reducción de características. Aumento de la regularización. Incremento del tamaño del conjunto de datos. Todas las anteriores. ¿Qué indicador se utiliza para medir la calidad de ajuste en modelos de regresión lineal?. AUC-ROC. R-cuadrado. Precisión. Sensibilidad. ¿Qué declaración SQL se utiliza para crear una nueva tabla que no exista previamente en la base de datos?. CREATE TABLE. NEW TABLE. ADD TABLE. INSERT TABLE. ¿Qué teorema es fundamental en la inferencia estadística para describir la distribución de muestras de tamaño adecuado, independientemente de la forma de la distribución de la población?. Teorema del límite central. Ley de los grandes números. Teorema de Bayes. Principio de Pareto. ¿Qué método se utiliza para transformar características categóricas en modelos que solo aceptan datos numéricos?. Normalización. Estandarización. Codificación One-hot. PCA. ¿Qué función en R se utiliza para aplicar una función a elementos en una lista y simplificar el resultado?. lapply(). sapply(). apply(). tapply(). ¿Qué declaración SQL se utiliza para obtener datos de una tabla basados en condiciones específicas?. SELECT. GET. FETCH. QUERY. ¿Qué estadístico se utiliza para identificar la medida que ocurre con mayor frecuencia en un conjunto de datos?. Media. Mediana. Moda. Varianza. ¿Qué tipo de gráfico sería más efectivo para mostrar la progresión de un valor a lo largo del tiempo?. Gráfico de barras. Gráfico circular. Gráfico de líneas. Diagrama de dispersión. ¿Qué cláusula SQL se utiliza para eliminar registros de una tabla de manera permanente?. REMOVE. DROP. DELETE. TRUNCATE. ¿Qué algoritmo es un ejemplo de aprendizaje supervisado?. K-medias. Árboles de decisión. Análisis principal de componentes (PCA). DBSCAN. ¿Qué métrica se utiliza para evaluar la precisión de un modelo de clasificación?. R-cuadrado. Precisión. Error cuadrático medio. AUC. ¿Qué declaración SQL se usa para combinar dos tablas basadas en una columna común?. MERGE. LINK. JOIN. UNION. ¿Qué librería de Python se utiliza para manipulación y análisis de datos, proporcionando estructuras de datos y operaciones para tablas numéricas?. NumPy. Pandas. Scikit-learn. TensorFlow. ¿Qué representa una variable aleatoria en un experimento probabilístico?. Un resultado específico del experimento. La probabilidad de que ocurra un evento. Una función que asigna un número a cada resultado posible. Una teoría predictiva sobre los resultados. ¿Qué herramienta de visualización se recomienda para representar datos que cambian en el tiempo?. Gráfico de líneas. Gráfico de barras. Gráfico circular. Diagrama de dispersión. ¿Qué medida estadística se utiliza comúnmente para estimar la variabilidad de un conjunto de datos?. Media. Mediana. Moda. Desviación estándar. ¿Qué cláusula SQL se utiliza para ordenar los resultados obtenidos de una consulta?. ORDER BY. SORT BY. GROUP BY. ALIGN BY. ¿Qué función se usa en R para calcular la media de un vector numérico?. sum(). mean(). median(). mode(). ¿Qué tipo de gráfico es más adecuado para mostrar las relaciones entre múltiples pares de variables?. Gráfico circular. Histograma. Gráfico de líneas. Diagrama de dispersión matricial (scatterplot matrix). ¿Qué comando SQL se utiliza para crear un nuevo índice para mejorar las consultas en una columna específica de una tabla?. CREATE INDEX. ADD INDEX. MAKE INDEX. SET INDEX. ¿Qué técnica se utiliza comúnmente para examinar las interrelaciones entre tres o más variables cuantitativas?. Análisis de regresión. Análisis factorial. Correlación de Pearson. Análisis de varianza (ANOVA). ¿Qué técnica de machine learning es apropiada para identificar patrones en datos sin etiquetas previas?. Regresión. Clasificación supervisada. Clustering. Refuerzo. ¿Qué declaración SQL se utiliza para agregar una restricción de clave externa a una tabla existente?. ADD CONSTRAINT. ALTER TABLE. UPDATE CONSTRAINT. SET FOREIGN KEY. ¿Qué distribución se utiliza comúnmente para modelar el número de veces que ocurre un evento en un intervalo de tiempo fijo?. Binomial. Normal. Poisson. Exponencial. ¿Qué función en R se utiliza para realizar un análisis de regresión lineal?. lm(). glm(). lapply(). kmeans(). ¿Cuál prueba estadística se usa para verificar la independencia de dos variables categóricas?. Prueba t de Student. ANOVA. Chi-cuadrado. Prueba F. ¿Qué estructura de datos en Python es mejor para operaciones rápidas de búsqueda, inserción y eliminación de elementos sin un orden específico?. Listas. Diccionarios. Conjuntos. Tuplas. ¿Qué gráfico es más efectivo para representar datos categóricos comparando tamaños relativos?. Gráfico de líneas. Gráfico de barras. Diagrama de dispersión. Gráfico circular. ¿Qué cláusula SQL se utiliza para regresar sólo filas distintas de una consulta?. DISTINCT. UNIQUE. DIFFERENT. EXCLUSIVE. ¿Qué algoritmo es típicamente utilizado para la clasificación de textos?. Regresión lineal. K-medias. Redes neuronales. Análisis de componentes principales. ¿Qué métrica indica el porcentaje de variabilidad en el conjunto de datos que es explicado por un modelo estadístico?. Coeficiente de correlación. R-cuadrado. Error estándar. Beta. ¿Qué declaración SQL se utiliza para modificar una columna existente en una tabla?. MODIFY COLUMN. ALTER TABLE. CHANGE COLUMN. UPDATE COLUMN. ¿Qué tipo de distribución se utiliza comúnmente para modelar eventos binarios en experimentos de tamaño fijo?. Normal. Poisson. Binomial. Exponencial. ¿Qué método se utiliza para identificar y tratar valores atípicos en un conjunto de datos?. Normalización. Clustering. Detección de anomalías. Codificación. ¿Qué librería de Python se utiliza comúnmente para operaciones de álgebra lineal?. Pandas. Scipy. NumPy. Matplotlib. ¿Qué test se utiliza para determinar si tres o más medias son estadísticamente diferentes?. Prueba t de Student. Chi-cuadrado. ANOVA. Prueba de Mann-Whitney. ¿Qué función se utiliza para agregar un elemento al final de una lista en Python?. append(). extend(). insert(). push(). ¿Qué tipo de gráfico sería más efectivo para mostrar la estructura de las relaciones jerárquicas entre varias categorías?. Gráfico de barras. Diagrama de árbol (Tree map). Gráfico de líneas. Diagrama de dispersión. ¿Qué declaración SQL se utiliza para retornar solo filas distintas?. SELECT UNIQUE. SELECT DISTINCT. SELECT DIFFERENT. SELECT ALONE. ¿Qué algoritmo se utiliza comúnmente para clasificación binaria?. Regresión lineal. K-medias. Regresión logística. Análisis de componentes principales. ¿Qué métrica mide la calidad del ajuste de un modelo de regresión lineal?. Precisión. Recall. R-cuadrado. AUC. ¿Qué comando SQL se usa para agregar una columna a una tabla existente?. ADD COLUMN. ALTER TABLE. UPDATE TABLE. INSERT COLUMN. ¿Qué distribución describe la probabilidad de obtener exactamente k éxitos en n ensayos independientes?. Normal. Binomial. Poisson. Exponencial. ¿Qué técnica es esencial para preparar datos antes de modelar, especialmente para normalizar o estandarizar características?. Limpieza de datos. Transformación de datos. Codificación de características. Todas las anteriores. ¿Qué librería de Python es extensamente utilizada para análisis estadístico y modelado?. NumPy. Pandas. SciPy. Matplotlib. ¿Qué técnica estadística se utiliza para analizar la relación entre una variable dependiente y múltiples variables independientes?. Regresión lineal múltiple. Análisis factorial. Correlación de Pearson. Chi-cuadrado. ¿Qué método de las listas en Python se usa para añadir varios elementos al final de la lista?. append(). extend(). insert(). update(). ¿Qué gráfico sería el más adecuado para analizar la distribución de una variable continua?. Gráfico de barras. Gráfico circular. Histograma. Gráfico de líneas. ¿Qué cláusula SQL se utiliza para filtrar los resultados de una consulta según condiciones específicas?. WHERE. FILTER. SELECT. HAVING. ¿Qué algoritmo es eficaz para clasificar datos en grupos sin etiquetar previamente?. Clustering. Regresión lineal. Regresión logística. Redes neuronales. ¿Qué comando SQL se usa para cambiar el nombre de una columna en una tabla existente?. RENAME COLUMN. ALTER TABLE. UPDATE TABLE. MODIFY COLUMN. ¿Qué tipo de distribución es adecuada para modelar la cantidad de veces que ocurre un evento durante un intervalo de tiempo dado?. Normal. Binomial. Poisson. Exponencial. ¿Qué método se utiliza para transformar una variable categórica en una forma que pueda ser utilizada por algoritmos de machine learning que requieren entrada numérica?. Normalización. Codificación One-hot. Escalado. Discretización. ¿Qué función en R se utiliza para aplicar una operación a elementos en una lista y simplificar el resultado automáticamente?. lapply(). Sapply(). apply(). map(). ¿Qué test se utiliza para evaluar si la varianza entre dos grupos es estadísticamente diferente?. Prueba t de Student. ANOVA. Test de Levene. Chi-cuadrado. ¿Qué medida se utiliza para estimar el valor central de un conjunto de datos?. Media. Mediana. Moda. Desviación estándar. ¿Qué estructura de datos en Python es inmutable y puede ser utilizada para almacenar elementos de diferentes tipos?. Lista. Diccionario. Conjunto. Tupla. ¿Qué gráfico es más adecuado para comparar la distribución de una variable continua entre varios grupos?. Gráfico de barras. Gráfico circular. Diagrama de caja. Histograma. ¿Qué cláusula SQL se utiliza para agrupar filas que tienen los mismos valores en columnas especificadas?. GROUP BY. ORDER BY. SORT BY. AGGREGATE BY. ¿Qué tipo de aprendizaje utiliza recompensas y penalizaciones para guiar el proceso de aprendizaje?. Aprendizaje supervisado. Aprendizaje no supervisado. Aprendizaje por refuerzo. Aprendizaje profundo. ¿Qué término se utiliza para describir un modelo que se ajusta excesivamente a los datos de entrenamiento, perdiendo capacidad de generalización?. Underfitting. Overfitting. Cross-validation. Regularization. ¿Qué cláusula SQL se utiliza para restringir las filas devueltas por una consulta basada en condiciones agregadas?. WHERE. HAVING. FILTERING. RESTRICT. ¿Qué representa el valor p en un test estadístico?. La probabilidad de que la hipótesis nula sea cierta. La probabilidad de rechazar la hipótesis nula cuando es cierta. La probabilidad de observar un efecto al menos tan extremo como el efecto observado bajo la suposición de que la hipótesis nula es cierta. La probabilidad de que la hipótesis alternativa sea cierta. ¿Qué técnica de preprocesamiento de datos es crucial para garantizar que todas las variables contribuyan equitativamente al modelo?. Codificación One-hot-. Normalización. Imputación. Binning. ¿Qué librería de Python es más adecuada para manipular y analizar datos estructurados complejos?. NumPy. Pandas. Matplotlib. TensorFlow. ¿Qué método se utiliza para probar si la diferencia entre las proporciones de dos grupos es estadísticamente significativa?. Prueba t de Student. Prueba de chi-cuadrado. Prueba z para proporciones. ANOVA. ¿Qué función se utiliza para eliminar un archivo en Python?. os.remove(). file.delete(). os.delete(). remove.file(). ¿Qué tipo de gráfico es óptimo para visualizar la relación entre dos variables continuas?. Gráfico de barras. Gráfico circular. Diagrama de dispersión. Histograma. |