IA - Modulo IV

COMENTARIOS

ESTADÍSTICAS

RÉCORDS

REALIZAR TEST

Título del Test:

IA - Modulo IV

Descripción:
Tipo V-F

Autor:

Quini

OTROS TESTS DEL AUTOR

Fecha de Creación: 2026/05/22

Categoría: Universidad

Número Preguntas: 9

Valoración:

(0)

COMPARTE EL TEST

Nuevo Comentario

Comentarios
NO HAY REGISTROS

Temario:

En el algoritmo Q-learning, si un agente emplea un factor gama de descuento de recompensas futuras igual a 1, entonces el agente da el mismo valor a las recompensas inmediatas y a todas las recompensas futuras. Verdadero. Falso.

Sea un enrono potencialmente no determinista, modelable como proceso de Markov. Si dos agentes distintos actúan en este entorno, empezando en el mismo estado s_i y empleando la política óptima, entonces ambos agentes obtienen siempre la misma recompensa acumulada. Verdadero. Falso.

En la evaluación de métodos de clasificación binaria, el término "falso negativo" se refiere a un caso negativo, que el método ha calificado erróneamente como positivo. Verdadero. Falso.

En el aprendizaje supervisado el objetivo es aprender una función a partir de un conjunto de ejemplos de entrenamiento. Verdadero. Falso.

El aprendizaje por refuerzo, la política óptima π*(s) devuelve aquella acción a en el estado s que tiene el mayor valor Q*(s,a) de todas las acciones posibles en s. Verdadero. Falso.

En entornos modelables con procesos de decisión de Markov, si una acción vuelve al mismo estado, esta acción se denomina no determinista. Verdadero. Falso.

El aprendizaje por refuerzo, la política óptima π*(s) devuelve el valor de la recompensa esperada máxima acumulada que se espera obtener a partir del estado s. Verdadero. Falso.

En Q-learning, la inicialización optimista de los Q(s,a) promueve la exploración de acciones. Verdadero. Falso.

En un problema de aprendizaje de árboles de decisión, es posible que uno de los atributos no aparece en ningún nodo del árbol. Verdadero. Falso.

Denunciar Test