M09 Validación y explotacion de datos
![]() |
![]() |
![]() |
Título del Test:![]() M09 Validación y explotacion de datos Descripción: Uf1 Tema 1 |




Comentarios |
---|
NO HAY REGISTROS |
Las variables cualitativas nominales: Usualmente es aquella que sólo toma valores enteros. Por ej: número de hijos por familia. Son las de mayor jerarquía matemática, y corresponden a aquellas que pueden asumir cualquier valor real dentro de un cierto rango… Por ejemplo: estatura, peso, edad, rendimiento de un cultivo, etc. Aquella cuyos valores son nombres o códigos sin relación de orden intrínseco entre ellos. Por ejemplo: sexo, estado civil, nacionalidad, religión, raza o color de piel, grupo sanguíneo. Corresponden a aquellas cuyos valores son nombres o códigos, pero con una relación de orden intrínseco entre ellos, es decir, sus valores conllevan un ordenamiento de mejor a peor o de mayor a menor. Por ejemplo: la calificación (excelente, bueno, regular, malo), la calidad (extra, primera, segunda…) el grado de las fuerzas armadas (General, Coronel, Capitán…, responsabilidad laboral). Si la frecuencia relativa de una variable es igual a 1: Todas las respuestas son falsas. Es la frecuencia relativa que se obtiene tras realizar un muestreo en poblaciones heterogéneas. No es posible poseer una frecuencia relativa igual a 1. Entonces dicha variable compone en su totalidad el tamaño de la muestra. El coeficiente de elevación (K) es un coeficiente necesario para saber la amplitud del intervalo al que hay que seleccionar los individuos en un muestreo. ¿De qué muestreo estamos hablando?. Muestreo estratificado. Muestreo aleatorio simple. Muestreo por conglomerados. Muestreo sistemático. Para el cálculo de cuartiles, se debe tener en cuenta: No se pueden calcular los cuartiles cuando poseemos datos pares. Todas las respuestas son incorrectas. Si los datos que se utilizarán para el cálculo de los cuartiles son números pares o impares. No se pueden calcular los cuartiles cuando poseemos datos impares. Se conoce como variación típica, desviación típica o desviación estándar.. Cuando tenemos el datos de variación estándar alto, nos informa que los datos están muy dispersión entre ellos. Es una medida del grado de dispersión de los datos con respecto al valor promedio. Todas son correctas. Cuando tenemos un dato de variación estándar pequeño, nos informa que hay poca dispersión entre los datos. Las tablas de las frecuencias: Permiten comprobar la frecuencia de aparición de datos. Clasifican dichos valores según la frecuencia de ocurrencia. Todas las respuestas son correctas. Por lo general, en la primera columna se anotan los diferentes valores de la variable (xi), y en las siguientes columnas muestran los diversos tipos de frecuencias. ¿Qué diferencias encontramos entre el muestreo por conglomerados y el muestreo estratificado?. En el muestreo por conglomerados, los conglomerados son heterogéneos en su interior y diferentes entre sí en propiedades y tamaño. En el muestreo estratificado, los estratos son homogéneos en su interior y diferentes entre sí. En el muestreo por conglomerados, los conglomerados son homogéneos en su interior y diferentes entre sí. En el muestreo estratificado, los estratos son heterogéneos en su interior y diferentes entre sí. Los muestreos por conglomerados y estratificados son el mismo tipo de muestreo. Todas las respuestas son correctas. El cuartil 1 (Q1): Divide el conjunto de datos en dos, es decir, por la mitad. Si hablamos en tanto por ciento, este corresponde al 50%. Este cuartil coincide con la mediana (Me), la mediana es el valor de la variable que divide los datos en dos partes iguales, con el mismo número de datos en su parte izquierda y en su parte derecha. Todas las respuestas son correctas. Divide los datos en una cuarta parte del total. Si hablamos en tanto por ciento, este correspondería con el 25% de los datos de la variable. Divide el conjunto de datos en tres cuartas partes del total. Si hablamos en tanto por ciento, este corresponde al 75%. Con qué variable medimos el nº de intervenciones quirúrgicas: Variable cuantitativa discreta. Variable cualitativa ordinal. Variable cuantitativa continua. Variable cualitativa nominal. Medir a diario la sal en (gr) a qué variable corresponde: Variable cuantitativa discreta. Variable cualitativa ordinal. Variable cuantitativa continua. Variable cualitativa nominal. El diagrama de cajas y bigotes, para su realización, se representa: Los tres cuartiles y los valores máximo de los datos sobre un rectángulo alineado horizontal o verticalmente. Los tres cuartiles y los valores mínimo y máximo de los datos sobre un rectángulo alineado horizontal o verticalmente. Los tres cuartiles y los valores mínimo y máximo de los datos sobre un rectángulo alineado horizontal o diagonal. Los tres cuartiles y los valores mínimo y máximo de los datos sobre un círculo alineado horizontal o verticalmente. Son valores de la variable, que dividen un conjunto ordenado de datos, en cien partes iguales. Percentiles. Deciles. Quintiles. Cuartiles. Los cuartiles dividen la muestra en cuatro partes iguales. El cuartil 1(Q1) coincide con el percentil 25(P25). El 25% de los datos de la variable están por debajo y el 75% por arriba. El percentil 50(P50) coincide con el cuartil 2(Q2), con la mediana (Me) y con el 50% de los datos. Separa los valores en dos partes iguales. El percentil 75(P75) coincide con el cuartil 3(Q3) y con el 75% de los datos. Todas las respuestas son correctas. Es un tipo de muestreo que se aplica cuando en la población existen claramente identificados dos o más subpoblaciones de interés para el estudio a realizar y se quiere asegurar una muestra con una cantidad de individuos de cada estrato en relación al tamaño de éste. A este muestreo se le conoce como: Muestreo aleatorio simple. Muestreo estratificado. Muestreo por conglomerados. Muestreo sistemático. En tablas de variables discretas, marca la respuesta CORRECTA: Al inicio de cada intervalo irá marcado por paréntesis () y corchetes [] en función de si el dato se encuentra o no formando parte del intervalo. El inicio de cada intervalo irá marcado por un corchete -[- que nos informará de la presencia de ese dato en el intervalo, es decir, si ese dato se encuentra incluido en el intervalo o no. El límite superior del intervalo irá delimitado por un paréntesis -)- que indicará que el dato no se encuentra en ese intervalo. Al final de cada intervalo irá marcado por paréntesis () y corchetes [] en función de si el dato se encuentra o no formando parte del intervalo. Todas las respuestas son incorrectas. Las variables estadísticas…. Todas las respuestas son falsas. Puede ser de tipo cualitativo que existen tanto las discretas como las continuas. Puede ser una variable cuantitativa discreta o una variable cuantitativa continua. Es una variable observable medible y constante. Tiene como objetivo conocer la situación actual de los hospitales de cada una de las diferentes comunidades autónomas y reunir en una sola operación estadística las diferentes demandas de información por parte de organismos estatales y autonómicos. Epidemiología. Demografía sanitaria. Estadística hospitalaria. Demografía dinámica. La estadística hospitalaria. Se encarga de recoger, organizar e interpretar los datos. Todas las respuestas son correctas. Es una tarea que supone una herramienta de trabajo fundamental para el Técnico Superior en Documentación Sanitaria. Es posible realizar infinidad de estudios que permiten visualizar la calidad del servicio, su eficiencia, los campos de mejorar, etc. El tipo de muestreo que consiste en seleccionar al azar a todos los individuos hasta componer la muestra (n), de modo que cada individuo tiene la misma probabilidad de ser seleccionado en la muestra, se conoce como: Muestreo sistemático. Muestreo aleatorio simple. Muestreo por conglomerados. Muestreo estratificado. La desviación típica.. Es una medida del grado de dispersión de los datos con respecto al valor promedio y se simboliza con sigma (σ). Cuando el valor del variación estándar altom los datos se encuentran muy dispersos entre ellos. Todas son correctas. Cuando el valor de la variación estándar es pequeño, hay poca dispersión entre los datos. La estadística hospitalaria. Tiene por objeto conocer la situación actual de los hospitales de cada una de las diferentes CCAA. Reduce el trabajo a realizar por los centros a la hora de cumplimentar los diferentes cuestionarios. Se encarga de recoger, organizar e interpretar los datos. Todas las respuestas son correctas. Una variable cualitativa ordinal: Es aquella cuyos valores son nombre o códigos sin una relación de orden intrínseco entre ello, ejemplo son: sexo, estado civil, nacionalidad, religión, etc. Es aquella que solo toma valores enteros, por ejemplo: número de hijos por familia, número de elementos defectuosos en una partida de repuesto o número de insectos por hoja. Son los de mayor jerarquía matemática, y corresponden a aquellos que pueden asumir cualquier valor real dentro de un cierto rango, por ejemplo: estatura, peso, edad, etc. Corresponde a aquella cuyos valores son nombres o códigos, pero con una relación de orden intrínseco entre ellos, es decir, sus valores conllevan un ordenamiento de mejor a peor o de mayor a menor, por ejemplo: la calificación (excelente, bueno, regular, malo), la calidad (extra, primera, segunda…). De los siguientes ejemplos, cuál corresponde a la variable cualitativa ordinal: Género. Peso. Numero de hijos por familia. Responsabilidad laboral. Las variables estadísticas…. Pueden ser cualitativas continuas o discretas. Puede ser una variable cuantitativa discreta o una variable cuantitativa continua. Las variables son observables medibles y constantes. Toda son falsas. En un gráfico de barras: Las barras no pueden superponerse. Todas las respuestas son correctas. El eje de valores debe comenzar en cero. Cada eje debe estar identificado. Para la realización de tablas de frecuencias de variables continuas: No hace falta agrupar los datos de menor a mayor. Todas las respuestas son falsas. Agrupamos los datos en intervalos. Los datos no se agrupan en intervalos ya que las variables continuas solo proporcionan datos de números enteros. Señala la opción CORRECTA: La estadística descriptiva, ordena, describir y sintetizar la información o los datos recogidos. Todas las respuestas son correctas. La estadística inferencial se utiliza para realizar deducciones o sacar conclusiones. Existen la estadística descriptiva y la estadística inferencial. Tal y como su propio nombre indica, la estadística descriptiva: Sirve para el contraste de hipótesis. Permite tomar previsiones. Se aplica para la descripción de poblaciones. Trata de inferir características generales de una población a partir de pruebas realizadas a una muestra de la misma. La estadística descriptiva se apoya en ciertas herramientas de medidas, marca la respuesta CORRECTA: Medidas de tendencia central (media, moda, mediana,…. Medidas de posición (deciles, cuartiles, percentiles,…). Todas las respuestas son correctas. Medidas de dispersión (varianza y desviación típica) y en las medidas de forma (coeficiente de Pearson). Cuál de las siguientes opciones corresponde a la finalidad de la estadística descriptiva: No es extraer conclusiones generales sobre el fenómeno que ha producido los datos bajo estudio, sino solamente su descripción. Trata de inferir características generales de una población a partir de pruebas realizadas a una muestra de la misma. Inferir conclusiones generales, tomar precisiones y predecir el comportamiento de ciertos fenómenos. Se apoya en la estadística inferencial y en la probabilidad. Estadística inferencial, marca la respuesta CORRECTA: Todas las respuestas son correctas. Trata de inferir características generales de una población a partir de pruebas realizadas a una muestra de la misma. Se apoya en la estadística descriptiva y en la probabilidad. Inferir conclusiones generales, tomar decisiones y predecir el comportamiento de ciertos fenómenos. No se limita meramente a la descripción de los datos, sino que, trata de inferir características generales de una población a partir de pruebas realizadas a una muestra de la misma. Estadística descriptiva. Estadística diferencial. Estadística. Estadística inferencial. El análisis descriptivo tiene como objetivo dar respuesta a alguna pregunta formulada al inicio del despliegue estadístico, cuál es uno esos objetivos: Describir tendencias. Recolectar y ordenar la información por medio de gráficas y medios visuales. Extraer las características más representativas de una colección de datos. Todas las respuestas son correctas. Cada una de las características o cualidades que poseen los individuos de una población. / Es una característica observable y medible, adquiere distinto valor entre una unidad de la muestra y otra. Variable interviniente. Variable estadística. Variable nominal. Variables cuantitativas. Cada elemento del universo debe tener la misma probabilidad de ser elegido en la muestra y que dicha probabilidad puede ser medida. Esta condición en el muestreo se conoce como: Aleatoriedad de la seleccion. Proceso de seleccion. Muestreo consecutivo. Todas las respuestas son correctas. El coeficiente de correlación (ρ) mide la fuerza y el sentido de la relación lineal entre 2 variables cuantitativas. Todas las respuestas son correctas. Si ρ = 1 → las variables tienen una dependencia exacta positiva. Si ρ = -1 → las variables tienen una dependencia exacta negativa. Por lo tanto, todos los datos de las dos variables coinciden si se plasman en una recta de regresión. El ρ > 0 → la dependencia entre las dos variables es positiva o directamente proporcional. Un coeficiente r de Pearson de 0,96 implica. Una correlación inversa y fuerte. Una correlación directa y fuerte. Una correlación directa y débil. Una correlación nula. Se utiliza para calcular la probabilidad o porcentaje de presencia de un suceso: Distribución muestral. Distribución de frecuencias acumuladas. Distribución de variables continuas. Distribución normal. Los datos se agrupan en intervalos. Variables continuas. Variables discretas. Variables nominales. Variables cualitativas. A la suma de las frecuencias absolutas de los valores inferiores o iguales a Xi, o número de medidas por debajo o igual que Xi, se le conoce con el nombre. Frecuencia absoluta acumulada (Fi). Frecuencia absoluta (ƒi). Frecuencia relativa acumulada (Hi). Frecuencia relativa (hi). El número de veces que aparece repetido un valor en cuestión de la variable estadística en el conjunto de las observaciones realizadas, se denomina: Frecuencia absoluta acumulada (Fi). Frecuencia relativa acumulada (Hi). Frecuencia absoluta. (ƒi). Frecuencia relativa (hi). En un ejercicio de estadística que tenemos que realizar, nos ofrecen los datos obtenidos de una muestra y nos solicitan realizar una tabla de frecuencias. ¿Cuál es uno de los primeros pasos a realizar?. Realizar la media para saber dónde está la mitad de la muestra. Ordenar los valores de la variable, preferentemente, de menor a mayor. Todas las respuestas son correctas. Hallar el coeficiente de elevación de la muestra. Indica la opción INCORRECTA. El coeficiente de elevación (K) se calcula con el fin de conocer la amplitud del intervalo con el que hay que seleccionar a los individuos. Todas son incorrectas. Consiste en realizar la elección de los individuos de forma sistemática, a intervalos regulares en el espacio o el tiempo, hasta obtener el número de sujetos necesarios para la muestra y donde el primer seleccionado sea elegido al azar. El coeficiente de elevación (K)se calcula, en el muestreo sistemático, para determinar cuál es el primer individuo de la muestra. Al cociente entre la frecuencia absoluta y el número de observaciones realizadas N, es decir, hi = ƒi/ N, se le conoce como: Frecuencia relativa (hi). Frecuencia absoluta acumulada (Fi). Amplitud del intervalo. Frecuencia relativa acumulada (Hi). Señala cuál de las siguientes afirmaciones es INCORRECTA: El estado civil es una variable cualitativa. El lugar que ocupa una persona entre sus hermanos (de mayor a menor edad) es una variable ordinal. La glucemia es una variable cuantitativa continua. La estatura de un individuo es una variable cuantitativa discreta. Son variables cuantitativas continuas. La altura de la población. El nivel de colesterol en sangre. A y B son correctas. Ninguna es correcta. El valor más repetido estadísticamente hace referencia a: Media muestral. Promedio. Moda. Todas las respuestas son correctas. ¿Qué es la distribución normal y cuáles son sus características principales?. Una distribución asimétrica con media igual a 0 y desviación estándar igual a 1. Una distribución simétrica con media y mediana diferentes. Una distribución simétrica con media y mediana iguales. Una distribución simétrica con media igual a 1 y desviación estándar igual a 0. En un muestreo estratificado proporcionado: Todas las respuestas son correctas. Los estratos únicamente tendrán un número igual de individuos si estos estratos aparecen en una proporción igual en la población. La muestra deberá tener estratos que guarden las mismas proporciones observadas en la población. El tamaño de las subpoblaciones resultantes en el universo son diferentes. Grupo de individuos o elementos con cualidades comunes que pueden observarse para analizar un fenómeno determinado en el universo. Muestra. Población. Muestras dirigidas. Muestras probabilísticas. Las tablas de doble entrada o tablas de contingencia: Todas las respuestas son falsas. Permiten conocer si existe una asociación o relación entre una única variable. Se relacionan entre 3 y 4 variables en una misma tabla. Es el paso posterior a la representación gráfica de los datos. Asignamos a cada persona de la población un número, introducimos los boletos en una urna y empezamos a extraer boletos al azar ¿De qué tipo de muestreo estamos hablando?. Muestreo sistemático. Muestreo aleatorio simple. Muestreo por conglomerados. Muestreo estratificado. Las tablas de doble entrada o tablas de contingencia: Permiten conocer si existe una asociación o relación entre dos tipos de variables diferentes. Todas las respuestas son falsas. Se relacionan entre 3 y 4 variables en una misma tabla. Es el paso posterior a la representación gráfica de los datos. La estatura, la edad, la altura, el peso… son posibles variables de estudios que se clasificarían dentro de: Variables cuantitativas discretas. Variables cualitativas nominales. Variables cuantitativas continuas. Variables cualitativas ordinales. Conjunto de individuos (personas, objetos, animales, etc.) sobre el que se desea aprender o conocer una característica de interés: Población. Muestra. Muestreo. Estimador. Valores que van de 10 en 10. Percentiles. Deciles. Cuartiles. Ninguna es correcta/ todas son correctas. En referencia a los cuartiles, deciles y percentiles, podemos afirmar que: El cuartil 1 (Q1) abarca el 25% de la muestra. El decil 4 (D4) abarca el 40% de la muestra. El cuartil 3 (Q3) es el percentil 75 (P 75). Todas las respuestas son correctas. Valores que van de 10%, 20%, 30%, 40%, 50%, 60%. Percentiles. Deciles. Cuartiles. Todas son correctas. En relación a los CUARTILES cuál es la verdadera: Tres números que dividen a la muestra. Los cuartiles son 25%, 50% y 75%. El Q2 corresponde a la mediana (Me). Todas son correctas. El valor límite que deja el 75% de la muestra ordenada por debajo es: Promedio. Percentil 75. Desviación estandar. Percentil 25. Número de hijos en un parto es una variable: Variable cualitativa nominal. Variable cuantitativa discreta. Variable cualitativa ordinal. Variable cuantitativa contínua. ¿Cuál de las siguientes afirmaciones sobre los cuartiles es CORRECTA?. Q1 divide el conjunto de datos en tres partes iguales. Q2 corresponde al valor que separa el 25% de los datos inferiores y el 75% de los datos superiores. Q3 siempre coincide con la media aritmética de los datos. Los cuartiles son útiles para entender la dispersión de los datos. ¿Qué representan los percentiles en una distribución normal?. Son los valores que dividen la distribución en intervalos iguales. Son los valores que indican la dispersión de los datos en la distribución. Son los puntos de corte que dividen la distribución en 100 partes iguales. Son los valores que representan un porcentaje específico de datos por encima de ellos. En referencia a los cuartiles, deciles y percentiles, podemos afirmar que: Q1. D4. Q3. Todas son correctas. ¿Cuál es la relación entre la media, la mediana y la moda en una distribución normal simétrica?. Siempre son iguales en una distribución normal. La mediana es menor que la moda. La media es mayor que la mediana y la moda. La media, mediana y moda son estadísticos diferentes y no están relacionados. ¿Cuál es la interpretación de la desviación estándar en una distribución normal?. Representa la distancia entre la media y la mediana. Indica la cantidad de valores atípicos presentes en los datos. Muestra la variabilidad o dispersión de los datos respecto a la media. Es una medida de tendencia central de los datos. ¿Qué significa que una distribución normal tenga una desviación estándar alta?. Los datos están más concentrados alrededor de la media. Los datos están más dispersos alrededor de la media. La media y la mediana son idénticas. La distribución es asimétrica. ¿Cómo se llama la forma de campana que presenta la distribución normal?. Forma uniforme. Forma exponencial. Forma de gussiana. Forma simétrica. ¿Cuál es la relación entre la desviación estándar y la anchura de la campana de la distribución normal?. A mayor desviación estándar, más ancha es la campana. A mayor desviación estándar, mayor altura de la campana. A mayor desviación estándar, menor altura de la campana. A mayor desviación estándar, más estrecha es la campana. Indica cuál de las siguientes opciones es una utilidad de la variable aleatoria: Permite la aplicación del análisis matemático y de otras herramientas para el estudio de situaciones incertidumbre. Pieza básica para el desarrollo de los métodos y técnicas inferenciales. Herramienta matemática que permite pasar del estudio de sucesos aislados al estudio de las distribuciones de probabilidad. Todas las opciones son correctas. Deseamos conocer la opinión de los ciudadanos de Málaga sobre el sistema de salud pública. Para ello, elegimos una muestra aleatoria de entre los abonados a telefónica. Entonces: La población de estudio es la de los ciudadanos de Málaga. El conjunto de abonados a Telefónica son la muestra. La población de estudio es la de los abonados a Telefónica. Ninguna de las respuestas anteriores es correcta. Calcula el CUARTIL 2 del siguiente conjunto de datos. 12, 15, 18, 21, 25, 27, 31, 33, 35, 38, 41, 45, 48, 51, 55, 58, 62, 66, 69, 73. 18. 45. 39. 38. Calcula el DECIL 4 del siguiente conjunto de datos. 14, 18, 22, 25, 29, 31, 35, 38, 40, 42, 45, 47, 49, 52, 54, 58, 61, 65, 68, 70. 38. 45. 52. 31. Los polígonos de frecuencias, señala la CORRECTA: Todas las respuestas son correctas. Se realiza a partir de la gráfica de un histograma. Se forma uniendo los puntos medios o marcas de clase (xi), de las barras de un histograma en su parte superior mediante segmentos. Se suelen representar variables cualitativas, aunque también se puede utilizar para variables cuantitativas. |