option
Cuestiones
ayuda
daypo
buscar.php

IA - Modulo IV

COMENTARIOS ESTADÍSTICAS RÉCORDS
REALIZAR TEST
Título del Test:
IA - Modulo IV

Descripción:
Tipo V-F

Fecha de Creación: 2026/05/22

Categoría: Universidad

Número Preguntas: 9

Valoración:(0)
COMPARTE EL TEST
Nuevo ComentarioNuevo Comentario
Comentarios
NO HAY REGISTROS
Temario:

En el algoritmo Q-learning, si un agente emplea un factor gama de descuento de recompensas futuras igual a 1, entonces el agente da el mismo valor a las recompensas inmediatas y a todas las recompensas futuras. Verdadero. Falso.

Sea un enrono potencialmente no determinista, modelable como proceso de Markov. Si dos agentes distintos actúan en este entorno, empezando en el mismo estado s_i y empleando la política óptima, entonces ambos agentes obtienen siempre la misma recompensa acumulada. Verdadero. Falso.

En la evaluación de métodos de clasificación binaria, el término "falso negativo" se refiere a un caso negativo, que el método ha calificado erróneamente como positivo. Verdadero. Falso.

En el aprendizaje supervisado el objetivo es aprender una función a partir de un conjunto de ejemplos de entrenamiento. Verdadero. Falso.

El aprendizaje por refuerzo, la política óptima π*(s) devuelve aquella acción a en el estado s que tiene el mayor valor Q*(s,a) de todas las acciones posibles en s. Verdadero. Falso.

En entornos modelables con procesos de decisión de Markov, si una acción vuelve al mismo estado, esta acción se denomina no determinista. Verdadero. Falso.

El aprendizaje por refuerzo, la política óptima π*(s) devuelve el valor de la recompensa esperada máxima acumulada que se espera obtener a partir del estado s. Verdadero. Falso.

En Q-learning, la inicialización optimista de los Q(s,a) promueve la exploración de acciones. Verdadero. Falso.

En un problema de aprendizaje de árboles de decisión, es posible que uno de los atributos no aparece en ningún nodo del árbol. Verdadero. Falso.

Denunciar Test