option
Cuestiones
ayuda
daypo
buscar.php

Fundamentos de Ciencias de Datos

COMENTARIOS ESTADÍSTICAS RÉCORDS
REALIZAR TEST
Título del Test:
Fundamentos de Ciencias de Datos

Descripción:
Preguntas aleatorias

Fecha de Creación: 2025/06/18

Categoría: Universidad

Número Preguntas: 49

Valoración:(0)
COMPARTE EL TEST
Nuevo ComentarioNuevo Comentario
Comentarios
NO HAY REGISTROS
Temario:

Según la diapositiva "Trampas del razonamiento", la forma en que se encuadra un problema: No tiene impacto en la decisión. Condiciona la decisión. Solo afecta a los datos cualitativos. Es irrelevante para el análisis de datos.

¿Qué fenómeno se ilustra con el ejemplo de la correlación entre los ingresos de las salas de juegos arcade y los doctorados en ciencias de la computación?. Causalidad directa. La necesidad de buscar evidencia que reafirma lo que pensamos. Correlación no implica causalidad. El impacto de las decisiones con datos.

En la Escalera de Inferencias de Chris Argyris (1994), ¿qué etapa sigue a "Observo datos y experiencias"?. Hago suposiciones. Añado significado. Seleccionar datos. Obtengo conclusiones.

Una aplicación de People Analytics mencionada es: Diseñar planes de marketing de productos. Predecir el nivel de satisfacción laboral de los empleados utilizando indicadores como evaluaciones de desempeño y encuestas de clima. Optimizar la cadena de suministro. Gestionar el inventario de la empresa.

¿Cuál de los siguientes no es lo mismo que Inteligencia Artificial, Machine Learning y Deep Learning?. Data Science. Machine Learning. Deep Learning. Artificial Intelligence.

Las variables cualitativas nominales se caracterizan por: Ser valores numéricos. Tener un orden inherente (ej. clasificación de satisfacción). Representar categorías sin un orden específico (ej. color de ojos). Medir cantidades discretas.

¿Qué tipo de variables cuantitativas pueden ser altura, temperatura o salario?. Cualitativas nominales. Cualitativas ordinales. Discretas. Continuas.

La Media Muestral se calcula como: La suma de las puntuaciones dividida por el número total de puntuaciones (n). La suma de los productos de cada valor por su probabilidad. El valor central de un conjunto de datos ordenado. El valor que aparece con mayor frecuencia.

La Mediana se define como: El valor promedio de un conjunto de datos. El valor que aparece con mayor frecuencia en un conjunto de datos. El valor que se encuentra en el medio de un conjunto de datos ordenado. La suma de las desviaciones al cuadrado de la media.

Si un conjunto de datos tiene dos modas, se dice que es: Amodal. Unimodal. Bimodal. Multimodal.

¿Qué mide la Varianza?. La distancia promedio de los datos a la moda. La distancia promedio al cuadrado desde la media, indicando la dispersión de los datos. El valor central de los datos. El número de veces que ocurre un evento.

Una varianza de 0 significa que: Hay una alta dispersión de datos. Todos los datos son iguales (no hay dispersión). La media es cero. La desviación estándar es alta.

Según la interpretación de los datos de desempeño, si la media del desempeño observado (178) es inferior a la media esperada (181), esto indica que: El desempeño promedio está por encima de lo anticipado. El desempeño promedio está por debajo de lo que se anticipaba. No hay variabilidad en los resultados. Todos los empleados rinden al mismo nivel.

La Probabilidad mide: El grado de subjetividad de un evento. La dispersión de los datos. El grado de ocurrencia de un evento, entre 0 (no ocurrirá) y 1 (ocurrirá). La frecuencia de un evento en un conjunto de datos.

El Espacio Muestral (S) se define como: El conjunto de todos los resultados posibles de un experimento aleatorio. La probabilidad de un evento específico. El número de resultados favorables. La relación entre dos eventos.

La probabilidad de un evento A, denotada como P(A), se calcula como: Número de resultados favorables / Número total de resultados posibles. Número total de resultados posibles / Número de resultados favorables. Suma de todas las probabilidades. 1 - P(no A).

El Teorema de Bayes permite calcular: La probabilidad de que no ocurra un evento. La probabilidad de un evento dado otro evento relacionado. La suma de probabilidades de eventos mutuamente excluyentes. La probabilidad de eventos independientes.

En el ejemplo de los escenarios de clima laboral, si cada escenario (A1, A2, A3) tiene una probabilidad de 1/3, ¿qué concepto de probabilidad se utiliza para calcular la probabilidad general de que un empleado se vaya?. Regla de la Complementariedad. Teorema de Bayes. Probabilidad Total. Regla de la Multiplicación para Eventos Dependientes.

El Análisis Exploratorio de Datos (EDA) tiene como objetivo: Realizar conteos de cuántas veces ocurre un evento en cada categoría. Calcular el valor promedio de un conjunto de datos. Buscar patrones en los datos utilizando diferentes técnicas y herramientas. Representar la densidad de probabilidad de una variable numérica.

Los Gráficos de Frecuencias son útiles para: Mostrar la proporción de cada categoría en relación con el total. Realizar conteos de cuántas veces ocurre un evento o cuántas observaciones hay en cada categoría de una variable. Representar la distribución de frecuencias de una variable numérica. Mostrar la relación entre dos variables numéricas.

¿Qué tipo de gráfico muestra la proporción de cada categoría en relación con el total, donde cada rebanada" es proporcional a la frecuencia de esa categoría?". Gráficos de Barras. Gráficos de Pareto. Gráficos de Sectores. Histograma.

El Gráfico de Pareto se basa en el principio de Pareto, también conocido como: La regla del 50/50. La regla del 80/20. La regla del 10/90. La regla del 30/70.

Un Histograma es un gráfico de barras que representa: La proporción de cada categoría. La distribución de frecuencias de una variable numérica, dividiendo los datos en intervalos. La relación entre dos variables numéricas. Tendencias a lo largo del tiempo.

Un Boxplot (diagrama de caja) se utiliza para mostrar: El promedio de una variable numérica por categoría. La distribución de una variable a través de sus cuartiles, destacando valores mínimos, máximos, mediana y atípicos. La densidad de probabilidad de una variable numérica. La correlación entre múltiples variables.

¿Qué tipo de gráfico es útil para mostrar la relación entre dos variables numéricas, representando los valores como puntos en los ejes X e Y?. Gráfico de Líneas. Histograma. Scatter Plot. Violin Plot.

Los Gráficos de Líneas son adecuados para: Comparar cantidades entre diferentes grupos. Mostrar tendencias a lo largo del tiempo o en un eje continuo. Representar la dispersión de los datos. Identificar las principales categorías que contribuyen a un fenómeno.

Un Violin Plot es similar al Boxplot pero además muestra: La suma total de la variable. La distribución de la variable numérica en forma de densidad. Solo los valores atípicos. La relación entre la media y la moda.

Un Heatmap utiliza colores para representar: La densidad de probabilidad de una variable. La intensidad de los valores en una matriz de datos numéricos. La relación entre categorías cualitativas. La evolución de las contrataciones a lo largo del tiempo.

El Machine Learning (ML) se define como: Un subconjunto del Deep Learning. Aplicación de la IA dedicada a la creación de algoritmos que permitan a los sistemas aprender sin intervención humana. Sistemas que imitan al cerebro humano. Un campo que estudia programas informáticos que razonan como humanos.

El Deep Learning (DL) es: Un modelo de regresión lineal. Un subconjunto del ML enfocado a la creación de redes neuronales artificiales. Una técnica de clasificación sin supervisión. Un sistema que requiere programación explícita.

En el ciclo de vida del machine learning, la primera etapa es: Análisis Exploratorio de los Datos (EDA). Adquisición y preparación de los datos. Definición de Objetivo de Negocios. Despliegue del modelo.

¿Qué tipo de machine learning es útil para predecir categorías o etiquetas?. Regresión. Clasificación. Asociación. Clustering.

Los modelos de Regresión en People Analytics permiten: Predecir categorías o etiquetas. Hacer estimaciones sobre valores continuos como desempeño o satisfacción. Clasificar empleados en grupos de riesgo. Identificar patrones sin predecir un valor.

La regresión lineal simple se utiliza para: Predecir un valor numérico (variable dependiente) en función de otro valor numérico (variable independiente). Clasificar datos en diferentes categorías. Identificar el valor más frecuente en un conjunto de datos. Analizar la dispersión de los datos.

En la fórmula de la regresión lineal simple ($Y = \beta_0 + mX$), la variable $X_i$ representa: La variable dependiente. El intercepto. La variable independiente (una característica que afecta a Y). La pendiente de la línea.

El objetivo de la regresión lineal simple en el caso práctico de RRHH (Años de Experiencia vs. Salario) es: Calcular la moda del salario. Analizar la relación entre los años de experiencia y el salario, proporcionando una estimación de salario basada en la experiencia. Clasificar los empleados por salario. Identificar los valores atípicos.

La regresión lineal múltiple es una extensión de la regresión lineal simple que: Utiliza una sola variable independiente para predecir. Usa varias variables independientes para hacer una predicción más precisa de una variable dependiente. Solo se aplica a variables categóricas. No es útil en Recursos Humanos.

En la fórmula de regresión múltiple ($y = b + m_1x_1 + m_2x_2 + ... + m_nx_n$), $m_1, m_2, ..., m_n$ son: Las variables dependientes. Los coeficientes o pendientes correspondientes a cada variable independiente. Los interceptos. Las características no relevantes.

Los modelos de clasificación son algoritmos de Machine Learning diseñados para: Predecir valores continuos. Categorizar datos en clases o etiquetas específicas. Reducir la dimensionalidad de los datos. Generar nuevas características de los datos.

¿Cuál de los siguientes no es un principal modelo de clasificación mencionado en el documento?. Regresión Logística. Árboles de Decisión. K-Nearest Neighbors (KNN). Regresión Lineal Simple.

Una aplicación de modelos de clasificación en Recursos Humanos es: Predicción de salarios. Filtrado de Candidatos para identificar los que mejor se ajustan a un puesto. Cálculo de la media esperada. Análisis de series de tiempo de desempeño.

En el contexto de la evaluación de modelos de clasificación, un "Falso Positivo (FP)" es cuando: El modelo predijo 1 y el valor real fue 1. El modelo predijo 0 y el valor real fue 0. El modelo predijo 1 y el valor real fue 0 (error tipo I). El modelo predijo 0 y el valor real fue 1 (error tipo II).

La "Sensibilidad (Sensitivity) o Recall o TPR)" de un modelo de clasificación mide: El porcentaje de predicciones positivas que realmente son positivas. La capacidad del modelo para identificar correctamente las observaciones negativas. La capacidad del modelo para identificar correctamente las observaciones positivas. El porcentaje de predicciones correctas sobre el total de observaciones.

La "Precisión (Precision)" de un modelo de clasificación mide: La capacidad del modelo para identificar correctamente las observaciones positivas. El porcentaje de predicciones positivas que realmente son positivas. La capacidad del modelo para identificar correctamente las observaciones negativas. El porcentaje de predicciones correctas realizadas por el modelo sobre el total de las observaciones.

La "Accuracy" de un modelo de clasificación mide: Solo la capacidad para identificar observaciones positivas. La capacidad para identificar observaciones negativas. El porcentaje de predicciones correctas realizadas por el modelo sobre el total de las observaciones. La probabilidad de un error tipo I.

En el Caso de Estudio "PredictHR en TalentCorp", de los 1250 empleados evaluados, 920 fueron clasificados por el cuestionario como en alto riesgo de abandono. Después de un año, 750 de esos 920 realmente abandonaron la empresa. ¿Qué representa el valor 750?. Verdaderos Negativos (VN). Falsos Positivos (FP). Verdaderos Positivos (VP). Falsos Negativos (FN).

En el mismo Caso de Estudio, se registraron 40 empleados que abandonaron la empresa aunque el cuestionario los había clasificado como de bajo riesgo. ¿Qué representan estos 40 empleados?. Verdaderos Positivos (VP). Verdaderos Negativos (VN). Falsos Positivos (FP). Falsos Negativos (FN).

Los árboles de decisión son algoritmos de machine learning utilizados en Recursos Humanos cuya estructura es similar a: Un gráfico de líneas. Un diagrama de flujo, donde cada nodo representa una decisión o pregunta. Una matriz de correlación. Un histograma.

Una aplicación de los Árboles de Decisión en People Analytics es: Calcular el promedio salarial. Predecir el aumento porcentual en el salario. Identificar empleados que podrían beneficiarse de programas de desarrollo (Planes de Capacitación). Determinar la desviación estándar del desempeño.

Denunciar Test