AYQUESERMINERO_2

COMENTARIOS

ESTADÍSTICAS

RÉCORDS

REALIZAR TEST

Título del Test:

AYQUESERMINERO_2

Descripción:
Test de Minería Web

Autor:

Monchochavea

OTROS TESTS DEL AUTOR

Fecha de Creación: 2026/06/01

Categoría: Otros

Número Preguntas: 26

Valoración:

(0)

COMPARTE EL TEST

Nuevo Comentario

Comentarios
NO HAY REGISTROS

Temario:

Dentro de los objetivos del proceso KDD (Knowledge Discovery in Databases), ¿cuál de las siguientes opciones se clasifica estrictamente bajo la categoría de "VERIFICACIÓN"?. Agrupamiento. Reglas de asociación. SQL, OLAP y Análisis estadístico. Clasificación (Árboles, Reglas, ANNs).

¿Cuál de las siguientes técnicas forma parte de las metas de "DESCUBRIMIENTO" (Descripciones o Predicciones) en el KDD?. Consultas SQL manuales. Redes de creencia, Agrupamiento y Regresión. Cubos OLAP estáticos. Verificación de hipótesis previa.

¿Qué define fundamentalmente al Aprendizaje Supervisado?. El analista debe monitorizar el algoritmo en tiempo real durante su ejecución. El conjunto de observaciones no posee ningún tipo de etiqueta o clase asociada. Cada observación incluye un valor de la clase a la que corresponde. Trata los datos exclusivamente como variables aleatorias sin estructurar.

¿Cuál es el propósito principal del Aprendizaje No Supervisado?. Explicar de forma exacta las causas que llevaron a tomar una decisión previa. Lograr una detección de patrones con un objetivo descriptivo y sin conocimiento a priori. Ajustar los datos a grupos y clases predefinidas por el administrador del sistema. Predecir variables continuas únicamente a través de funciones matemáticas lineales.

¿Cuáles son las cuatro técnicas fundamentales que integran el proceso de Preprocesamiento de datos?. Indexación, Rastreo, Ranking y Agrupamiento. Verificación, Descubrimiento, Clasificación y Regresión. Integración, Limpieza, Transformación y Reducción de datos. Filtrado, Ponderación, Segmentación y Descomposición.

Si un analista se enfrenta a un problema donde debe combinar datos provenientes de diferentes escalas (como un salario expresado en dólares frente a otro en peniques) o tratar con atributos derivados (salario mensual vs. anual), ¿en qué fase de preprocesamiento se encuentra?. Reducción de datos. Transformación de datos. Limpieza de datos. Integración de datos.

¿Cuál de las siguientes acciones NO corresponde a la fase de "Limpieza de datos"?. Rellenar valores perdidos. Identificar o eliminar valores anómalos (outliers). Cambiar el rango de los valores numéricos al intervalo estricto [0,1]. Suavizar el ruido de los datos y resolver inconsistencias.

Dentro de la Transformación de datos, ¿en qué consiste la operación de "Generalización"?. En la totalización de las ventas pasando de métricas mensuales a anuales. En el uso de jerarquías de conceptos, como pasar de calles a ciudades, o de edades numéricas a etiquetas como {joven, adulto, ...}. En obtener una representación reducida de filas y tuplas sin perder la integridad. En fusionar múltiples fuentes de bases de datos relacionales en una sola.

¿Cuál es el objetivo principal de la "Reducción de datos"?. Eliminar de forma permanente los registros antiguos para liberar almacenamiento en el servidor. Modificar la escala salarial de los empleados de peniques a dólares para evitar inconsistencias. Obtener una representación reducida del conjunto de datos sin perder su integridad, haciendo que la minería sea más eficiente obteniendo las mismas conclusiones. Convertir datos semiestructurados (HTML/XML) en tablas estructuradas tradicionales.

¿Cuáles son las dos técnicas principales en las que se divide el Aprendizaje Supervisado?. Agrupamiento (Clustering) y Series Temporales. Clasificación y Regresión (o predicción numérica). Reglas de Asociación y Patrones Secuenciales. SQL y Análisis Exploratorio.

La técnica de "Clasificación" consiste esencialmente en: Predecir una variable de tipo continuo o valor numérico puro. Establecer una correspondencia entre los datos y grupos predefinidos llamados clases. Observar cronológicamente la variación de un único atributo a lo largo del tiempo. Buscar correlaciones frecuentes entre artículos de una base de datos transaccional.

¿Cuáles son las dos etapas secuenciales del proceso de Clasificación descritas en el tema?. 1. Filtrado de ruido y 2. Discretización de variables continuas. 1. Construcción del modelo (Training) y 2. Utilización del modelo (Unseen Data). 1. Análisis de la cesta de la compra y 2. Segmentación de clientes. 1. Fusión de fuentes y 2. Reducción de atributos redundantes.

¿Qué tipo de variable es el objeto de predicción en la técnica de "Regresión"?. Una variable de tipo categórico o etiqueta nominal. Una clase binaria predefinida (por ejemplo, 'yes' o 'no'). Una variable de tipo continuo (valor numérico). Una ruta de navegación secuencial cronológica.

En el contexto de la regresión con árboles, ¿qué información proporciona específicamente una hoja del árbol para emitir una predicción?. Una regla condicional lógica de tipo IF-THEN exacta. Una cantidad numérica que representa la media de los ejemplos que llegan a dicha hoja. Una lista de enlaces entrantes ordenados por PageRank. Una etiqueta de clase nominal predefinida por el modelo de entrenamiento.

¿Cuál es la utilidad fundamental del "Análisis de series temporales"?. Predecir la clase nominal a la que pertenece un cliente nuevo basándose en sus atributos. Utilizar distancias para determinar la similitud entre series distribuidas cronológicamente y determinar o predecir comportamientos futuros. Reducir la dimensionalidad de las columnas de una matriz de datos transaccionales. Generar un resumen semántico automatizado de los snippets de los buscadores.

¿Por qué se considera al Agrupamiento (Clustering) como una "clasificación no supervisada"?. Porque requiere la intervención de un usuario experto para etiquetar cada grupo. Porque las clases o grupos no están predefinidos en los datos de entrada. Porque utiliza funciones matemáticas de regresión lineal para trazar las fronteras. Porque solo se puede aplicar sobre bases de datos transaccionales del tipo Market Basket Analysis.

¿Qué condiciones matemáticas debe cumplir un método de agrupamiento para ser considerado un "buen método"?. Maximizar la similitud inter-cluster y minimizar la similitud intra-cluster. Eliminar por completo las filas y mantener intactas todas las columnas redundantes. Maximizar la similaridad intra-cluster y minimizar la similaridad inter-cluster. Reducir los datos mediante discretización y normalización en el rango [0,1].

¿Cuáles son las aproximaciones metodológicas citadas para realizar Agrupamiento (Clustering)?. Construcción de reglas IF-THEN y árboles de regresión matemática. Particionamiento (ej. k-means), Jerárquicos y otros basados en densidad, rejillas o modelos. SQL, OLAP y Análisis Estadístico multivariante de verificación. Integración, Limpieza, Transformación y Reducción jerárquica.

El enfoque conocido como "Market Basket Analysis" (Análisis de la cesta de la compra) es un ejemplo clásico de: Clasificación supervisada con árboles de decisión. Predicción numérica mediante funciones continuas de regresión. Descubrimiento de asociaciones para encontrar relaciones desconocidas en datos transaccionales. Normalización y discretización en la reducción de atributos.

¿Cuál es el objetivo principal de las "Reglas de asociación"?. Establecer jerarquías de conceptos entre calles y ciudades del cliente. Encontrar reglas que correlacionen conjuntos de artículos en datos transaccionales. Calcular la media numérica de los ejemplos que caen en una hoja del árbol. Agrupar instancias maximizando la similitud inter-cluster.

¿Qué elemento fundamental añade la "Minería de patrones secuenciales" que la diferencia de las reglas de asociación simples?. La predicción de variables numéricas puramente continuas. El uso de un clasificador basado en árboles lógicos IF-THEN. El orden cronológico y las relaciones temporales entre los valores de los atributos. La eliminación de los valores anómalos u outliers.

De acuerdo con la tabla resumen de aplicaciones de la minería web, ¿qué técnicas corresponden al área de "Estructura"?. Resumen de páginas y agrupamiento de resultados de búsqueda. Seguimiento de patrones de acceso y Ranking de páginas (PageRank). Seguimiento personalizado y Sitios web adaptativos. Consultas estructuradas y búsqueda de precios automáticas.

¿Cuál de las siguientes es una aplicación específica de la Minería Web de Contenido dedicada a las consultas y extracción de información de productos?. CLEVER. WebOQL y ShopBot. Web Log Mining. MLDB.

Dentro de la minería de resultados de búsqueda de contenido, ¿en qué consiste la técnica de "Clustering Search Result"?. En calcular la importancia de una página web basándose exclusivamente en sus arcos dirigidos entrantes. En reestructurar automáticamente un sitio web aprendiendo del comportamiento histórico. En la categorización de documentos usando títulos y fragmentos (snippets) para ayudar al usuario a navegar por temas relacionados. En aplicar heurísticas complejas para distinguir si una web es personal o corporativa.

¿Qué herramientas o modelos se detallan en el tema como aplicaciones de la Minería Web de Estructura?. Web Page Summarization y ShopBot. Adaptive Sites y Web Log Mining. PageRank, CLEVER y MLDB. SQL, OLAP y k-means.

¿Qué es un "Sitio web adaptativo" (Adaptive Sites) dentro de las aplicaciones de Minería Web de Uso?. Una web que cambia su hoja de estilos CSS según el tamaño de la pantalla del dispositivo móvil. Un sitio que se reestructura automáticamente aprendiendo del comportamiento individual de cada usuario. Una plataforma que permite realizar comparaciones automatizadas de precios de productos de distintas tiendas. Un índice multinivel estructurado en base a la popularidad global de los hipervínculos.

Denunciar Test