option
Cuestiones
ayuda
daypo
buscar.php

Parcial 2 Psicometría

COMENTARIOS ESTADÍSTICAS RÉCORDS
REALIZAR TEST
Título del Test:
Parcial 2 Psicometría

Descripción:
T7-12 África

Fecha de Creación: 2025/12/16

Categoría: Otros

Número Preguntas: 90

Valoración:(0)
COMPARTE EL TEST
Nuevo ComentarioNuevo Comentario
Comentarios
NO HAY REGISTROS
Temario:

Con respecto a la validez: Se considera que tipos de evidencias o pruebas de la validez de un test. La validez de constructo es la fundamental. Se debe considerar que hay distintos tipos de validez.

Se entiende por criterio: El universo de contenidos que sirve para crear el test. La conducta que se predice con los resultados del test. El constructo que se apresa con el test.

El uso de jueces se realiza para corroborar la validez: De contenido. Consecuencial. De criterio.

La validez de contenido supone que: Hay precisión en los ítems elegidos. Se ha muestreado adecuadamente todo el universo al que pertenece el atributo. El atributo a medir se ha comparado con un criterio externo.

Para validar un test: Hay que garantizar previamente su fiabilidad por medio de test-retest. Hay que saber psicometría y la teoría subyacente del test. Hay que tener criterios externos.

Una de las características que debe tener un criterio es que sea: Fácil de obtener. Homogéneo. Una relación lejana si queremos ver divergencia.

La validez aparente está incluida en la validez: De criterio. De constructo. De contenido.

Validar un test supone: Garantizar que el test está libre de errores. El proceso de acumular evidencias sobre él. Asegurar que hay normas aplicables a la población de referencia.

El enfoque fundamental en la validez de criterio: Es que se da más importancia al aspecto teórico que al empírico. Es que se da la misma importancia al aspecto empírico que al teórico. Es que se da más importancia al aspecto empírico que al teórico.

La validez de criterio se calcula: Mediante el análisis factorial. Con el coeficiente de correlación. Con la matriz multirrasgo-multimétodo.

La matriz multirrasgo multimétodo se emplea para: Establecer la validez consecuencial. Establecer la validez predictiva. Establecer la validez de constructo.

La validez se ve influida por el tamaño del test: Porque a menor longitud, mayor fiabilidad y mayor validez. Porque a mayor longitud, mayor fiabilidad y mayor validez. Porque a mayor longitud, menor fiabilidad y menor validez.

Para llevar a cabo la validez de constructo: Hay que contar previamente con el juicio de expertos. Hay que establecer criterios externos con los que comparar el test. Hay que planificar y ejecutar investigaciones para su comprobación empírica.

La validez consecuencial: Exige establecer variables que discriminen sobre el constructo a medir. Se determina relacionando un test con un criterio externo. Se preocupa por los efectos sociales y personales de la evaluación.

Mediante las fórmulas de atenuación, la disminución del error en el test: Aumenta el coeficiente de fiabilidad del test. Aumenta el coeficiente de fiabilidad del criterio. Aumento el coeficiente de validez entre test y criterio.

El coeficiente de validez: No se ve influido por el tamaño de la muestra. Es mayor si la muestra es homogénea. Es menor si la muestra es homogénea.

Se entiende por fórmulas de atenuación: Las que permiten estimar la validez si no hubiera error en el test. Las que permiten estimar la validez si no hubiera error ni en el test ni en el criterio. Las que permiten estimar la validez si no hubiera error en el criterio.

El análisis factorial exploratorio se emplea para: Determinar la validez de constructo. Fundamentar la matriz multirrasgo-multimétodo. Establecer la validez de contenido.

La validez de constructo exige: Establecer el diseño y la forma en que se va a recopilar el test. Hacer, al menos, dos formas paralelas del test. Formular hipótesis relevantes.

La estrategia diferencialista en la determinación de la validez de constructo consiste en: Correlacionar el test con atributos relacionados. Comparar el rendimiento en el test entre grupos que difieran del atributo medido. Diseñar experimentos manipulando la variable independiente.

La matriz de correlaciones en el AFE: Se hace después de calcular la matriz reproducida. Es el punto de partida del análisis. Se calcula tras la rotación de factores.

La ventaja de reducir dimensiones en el AFE supone: Eliminar la variabilidad entre los ítems. Encontrar una forma más amplia de entender el conjunto de variables. Poder entender mejor el conjunto de variables que conforman un factor.

El criterio de Cattell: Supone seleccionar factores con valor propio superior a 1. Es un procedimiento gráfico para determinar factores a retener. Es una prueba de bondad de ajuste para retener factores.

Las relaciones entre variables en el AFE: Se fijan a priori. No se conocen de antemano. Vienen corroborados por contraste de hipótesis.

En el AFE a diferencia del AFC: Se corroboran los factores por contraste de hipótesis. No se conocen los factores. Se conocen las relaciones entre factores.

La prueba KMO se usa para: Determinar cuántos factores retener. Determinar si se puede seguir con el AFE. Establecer el criterio para asignar ítems a los factores.

Los factores que se extraen en el AFE: Se interpretan a priori. No todos tienen la misma importancia. Explican el mismo porcentaje de variabilidad.

El criterio de Kaiser: Permite determinar si la rotación ha de ser ortogonal. Retiene factores en función de la gráfica de sedimentación. Se ha usado para determinar cuántos factores retener en el AFE.

El análisis factorial se debe a: Galton. Spearman. Cronbach.

La rotación en el análisis factorial se realiza para: Facilitar la interpretación de los factores extraídos. Asegurar que se han elegido los factores relevantes. Garantizar la independencia de los factores.

En el AFE se puede obtener también: La puntuación de cada persona en el ítem. La puntuación de cada persona en la matriz de correlaciones. La puntuación de cada persona en el factor.

Se preferirá la rotación oblicua a la ortogonal: Cuando se quiera preestablecer un número dado de factores. Cuando se sepa que los factores son independientes. Preferiblemente, salvo que la correlación entre factores no alcance 0,20.

En el AFE, a diferencia del AFC: No se conocen los factores. Se corroboran los factores por contraste de hipótesis. Se conocen las relaciones entre factores.

Según los estudios más recientes sobre AFE, el número recomendado que debe tener la muestra: Debe ser al menos de 200 casos. Debe ser al menos 5 casos por ítem. Si las saturaciones son de 0,70 o más, se precisan 400 casos.

Para aceptar que hay un buen ajuste en AFC, los índices GFI, AGFI y CFI deben ser (en su mayor parte): Superiores a 0,30. Superiores a 0,70. Superiores a 0,90.

En el AFC: El investigador decide si rotar o los factores extraídos. Es imprescindible rotar los factores, para comprobar que se ajusta al modelo inicial. No hace falta rotar los factores.

Una de las diferencias entre AFE y AFC es que: En el AFC los factores se fijan a priori. En el AFC hay factores y en el AFE no. Que en el AFC no se conocen las relaciones entre factores y en el AFE si.

Se entiende por puntuación factorial: La que se da cuando se suman todos los factores para todos los evaluados. El cálculo de las puntuaciones de cada persona en cada factor. El cálculo de las puntuaciones de cada persona en cada factor en AFC.

En estudios más recientes sobre AFE, para considerar que el ítem pertenece a un factor, su saturación: Debe ser superior a 0,30. Debe ser superior a 0,40. Debe estar entre 0,25 y 0,70.

Los factores en el AFC: Se determinan en factor del valor propio obtenido. Se conocen previamente a hacer el análisis. Vienen corroborados por contraste de hipótesis.

Si un test tiene pocos ítems: Los índices de homogeneidad se calculan duplicando el ítem en concreto de la suma de puntuaciones. Los índices de homogeneidad se calculan eliminando el ítem concreto de la suma de puntuaciones. Los índices de homogeneidad se calculan incluyendo el ítem en concreto en la suma de puntuaciones.

En el análisis de ítems, es preferible eliminar: Un ítem con bajo índice de homogeneidad, aunque el índice de validez sea adecuado. Un ítem con alto índice de validez, aunque el índice de homogeneidad sea adecuado. Un ítem con bajo índice de validez, aunque el índice de homogeneidad sea adecuado.

El índice de dificultad se calcula: Dividiendo el número de aciertos obtenidos en el test con el total de respuestas de las personas que intentaron responderlo. El número de aciertos obtenidos en el ítem en relación al ítem paralelo correspondiente. Correlacionando las respuestas de las personas que intentaron responder el test.

Los valores del índice de dificultad oscilan entre: Entre 0 y 1. Entre 1 y 10. -1 y +1.

Cuánto más alto es el valor del índice de dificultad: Mayor es la correlación total con el test. Más difícil es el test. Más fácil es el test.

Los distractores en un test de opción múltiple son adecuados cuando: Su frecuencia de respuesta es menor que la de la opción correcta y la frecuencia de respuesta es mayor en uno de los distractores. Su frecuencia de respuesta es mayor que la de la opción correcta y la frecuencia de respuesta es homogénea en los diversos distractores. Su frecuencia de respuesta es menor que la de la opción correcta y la frecuencia de respuesta es homogénea en los diversos distractores.

El índice de validez de un ítem: Se calcula correlacionando el ítem con el criterio. Es igual al coeficiente de validez del test. Se calcula correlacionando el test con el criterio.

El índice de homogeneidad se calcula: Correlacionando las puntuaciones de ese ítem con el conjunto de ítems pares del test. Correlacionando las puntuaciones de ese ítem con el test, pero siempre que el número de ítems sea inferior a 20. Correlacionando las puntuaciones de ese ítem con la puntuación total obtenida en el test.

El índice de dificultad está directamente relacionado con: Con la media. Con la varianza. Con la mediana.

Conviene descartar un ítem si su índice de homogeneidad: No correlaciona con el criterio. Tiene una dificultad de 0,90. Es menor a 0,30.

Las puntuaciones típicas: No usan valores decimales ni negativos. Si son normalizadas, se usan indistintamente con tanto si las distribuciones subyacentes son normales como si no. Son más exactas, pero menos intuitivas que las puntuaciones centiles.

La baremación hay que realizarla: Únicamente cuando se hace el test, junto con los cálculos de fiabilidad y validez. Repitiéndola cada cierto tiempo. Repitiéndola cada cinco años.

CI significa: Cociente intelectual. Coeficiente intelectual. Curva de incidencia.

Las escalas derivadas: Dan la situación relativa en porcentaje que un individuo tiene en un grupo. Son más fáciles de entender que las puntuaciones típicas. Se basan en puntuaciones típicas normalizadas.

Las escalas de Estaninos: Son puntuaciones z (normalizadas o no), con media 100 y desviación típica 15. Son puntuaciones z normalizadas con media 5 y desviación típica 2. Son puntuaciones z (normalizadas o no), con media 50 y desviación típica 10.

Los baremos normativos: No son aplicables a los baremos percentiles. Sólo valen durante 5 años. Se realizan basándose en el grupo de referencia.

Los baremos sirven: Para garantizar la disminución del error de medida. Para poder interpretar los resultados de un test psicológico. Para garantizar la invarianza de las poblaciones.

Una de las desventajas de las puntuaciones normalizadas: Es que es difícil de interpretar, debido a sus valores negativos y decimales. Es que aporta una medida relativa y que facilita la comparación de puntuaciones. Es que no exige ninguna transformación, se toma directamente el valor obtenido.

Los baremos centiles: Son poco usados en Ciencias de la Salud. Se mide en una escala de intervalo. Son una medida de posición del individuo en su grupo.

Se entiende por puntuación típica estándar: La diferencia de la puntuación con la media de la distribución y dividida por la desviación típica de las puntuaciones del individuo en el test. La diferencia de la puntuación con la media de la distribución y dividida por la desviación típica. La diferencia de la puntuación con la media de las puntuaciones del individuo en el test y dividida por la desviación típica de la distribución.

En el cálculo del Coeficiente de Livingston para calcular la fiabilidad en los TRC: Aumenta su valor conforme el punto de corte se acerca a la media. Su valor aumenta cuando el punto de corte se aleja de la media. Disminuye su valor conforme el punto de corte se aleja de la media.

Entre los desarrollos que han propiciado los tests referidos al criterio se encuentran: Establecer baremos de referencia para la interpretación de los tests. Ayudan a detectar dificultades del aprendizaje. La estimación de un rasgo latente.

Uno de los aspectos relevantes en el análisis de los ítems en los TRC es: Determinar la validez mediante análisis factorial. Dividir los ítems en pares e impares. Emparejar ítems y dominio.

Los tests referidos al criterio: Tienen su punto de auge en la segunda mitad de los años 80. Disminuye su relevancia a finales del siglo XX. Surgen en los años 60.

En los TRC, la longitud del test: Es un tema de tal relevancia que hay que determinarlo. Cuanto más corto es, menores errores de clasificación. Un test corto permite una mejor interpretación.

Una de las formas de calcular la fiabilidad mediante dos aplicaciones del test en los TRC es: Mediante el método de Subkoviak. Mediante el modelo de Millman. Mediante la Kappa de Cohen.

Los TRN se diferencian de los TRC: En que los TRN emplean para la selección de ítems los objetivos del test. En que la evaluación de los participantes supone un estimador del rendimiento del evaluado. En que en su construcción, los TRN se basan en alguna teoría de rasgos.

Se entiende por tests referidos a la norma: Los que se centran en el análisis de ítems. Los que evalúan a los informantes en referencia al grupo normativo. Los que proporcionan habilidad del evaluado.

Se entiende como tests referidos al dominio: Los que establecen estándares mediante puntos de corte. Los que califican al evaluado según la norma. Aquellos que estiman la puntuación del dominio del evaluado.

La elección del punto de corte basado en el método de Nedelsky: Es para tests de ítems con elección múltiple. Valora la competencia máxima. Las distintas alternativas son valoradas por el diseñador del test.

Uno de los supuestos de la TRI es: La unidimensionalidad. La existencia de una distribución no lineal entre las dimensiones. La existencia de dos dimensiones.

La unidimensionalidad supone que: Las respuestas a los ítems dependen de un solo rasgo. Solo se puede estimar un parámetro. Se da una única respuesta, que corresponde a un rasgo.

La independencia local permite: Determinar la probabilidad de un patrón de respuesta. La probabilidad de fallar las respuestas, pero no de acertarlas. La probabilidad de acertar las respuestas, pero no de fallarlas.

El atributo a medir, según la TRI: No es directamente observable, pero se estudia analizando el total del test. No es directamente observable, pero se puede analizar a través de las respuestas a los ítems de un test. Es directamente observable y se estudia a través de las respuestas de un ítem a un test.

Una de las limitaciones de la TCT es: Que no siempre es posible calcular la fiabilidad. Que la puntuación de un evaluado depende del test que se aplique. Que tiene independencia local.

Cuando se comprueba el supuesto de unidimensionalidad del test mediante un análisis factorial: Al menos los dos primeros factores deben explicar más de un 25% de la varianza. Los factores con valor propio superior a uno deben explicar más del 50% de la varianza. El primer factor debe explicar más de un 25% de la varianza.

Los modelos de TRI dependen de: Que el tipo de respuesta sea politómico o dicotómico. El tipo de respuesta y del tipo de función matemática usada. De si usa función logística o curva normal acumulada.

Entre los objetivos de la TRI cabe citar: Proporcionar instrumentos sensibles respecto al instrumento de medida utilizado. Garantizar una puntuación equilibrada para cada evaluado. Que las propiedades de los instrumentos no dependan de los objetos medidos.

El error típico de medida en la TRI: Depende del parámetro que estimemos. Es diferente para cada persona. Es igual para todos los evaluados.

La invarianza se refiere a: La muestra de referencia, que se mantiene igual siempre que el test que mida el rasgo sea igual. En cuanto a propiedades de los ítems, la dificultad no depende de la muestra normativa. En cuanto al rasgo, la puntuación depende de la muestra de referencia.

En los tests adaptativos informatizados (TAI): El programa calcula cada parámetro y presenta los ítems en función de ello. Todos los evaluados responden a los mismos ítems. El programa calcula el nivel de atributo de la persona evaluada y presenta los ítems en función de ello.

Se entiende por funcionamiento diferencial del ítem (DIF): Que el ítem está libre de sesgos. Que el ítem tiene una dificultad mayor que los restantes que componen el test. Que diferentes grupos de evaluados tienen una probabilidad distinta de acertar la respuesta.

La función de información del test en TRI: Equivale al concepto de fiabilidad en la TCT para determinados valores de la escala. Equivale al concepto de validez en la TCT. Informa sobre la independencia local de los ítems.

En la estimación de parámetros, el cálculo por máxima verosimilitud supone: Es probable que se de un patrón de conducta determinado, sabiendo el nivel de rasgo que posee una persona. La probabilidad de encontrar θ es sumamente probable. La probabilidad de encontrar el nivel de rasgo, dado el patrón de conducta realizado.

La función de información: Cuanto mayor sea, mayor será el error de estimación. Es la inversa del error típico de estimación. Es independiente del error típico de estimación.

El modelo de un parámetro: Es el que establece la discriminación del ítem. Se conoce como b. Es la base para el modelo de dos y tres parámetros, pero raramente se emplea.

El parámetro a: Corresponde al modelo de un parámetro. Corresponde al modelo de dos parámetros. Corresponde al modelo de Rasch.

El parámetro c: Significa pseudo azar. Significa sumar a pseudo azar discriminación. Significa respuesta por azar para niveles altos de rasgo.

En el modelo de tres parámetros: El parámetro, según este modelo, es acertar al azar cuando θ es moderadamente alto. Añade, a dificultad y discriminación, la probabilidad de acertar al azar. Se basa en un único parámetro, acertar al azar cuando θ es muy pequeño.

Los valores entre los que oscila el parámetro a de TRI son: Entre -3 y 0. Entre 0,3 y 2,5. Entre +3 y -3.

Denunciar Test