Una clasificación de la minería web, divide esta en: Minería web de uso y contenido Minería web de estructura, de uso y de contenido Minería web de estructura, uso, contenido y hipertextos. Las fases del preprocesamiento son: integración, limpieza, transformación y... rellenar valores pedidos reducción de dimensionalidad reducción de dimensionalidad y rellenar valores perdidos. Dentro del aprendizaje supervisado nos encontramos con Técnicas de agrupamiento y reglas de asociación Técnicas de clasificación y agrupamiento Técnicas de clasificación y regresión. Algunas técnicas de regresión que podemos utilizar son: basados en densidad y árboles de regresión regresión lineal, árboles de regresión, algoritmos jerárquicos regresión lineal y árboles de regresión. La minería de patrones secuenciales busca descubrir relaciones temporales entre valores de atributos observar la variación del valor de un atributo en el tiempo descubrir relaciones desconocidas o correlaciones. Los algoritmos de agrupamiento deben producir grupos(clusters) que: Max. la similaridad inter-cluster y tenga máxima cobertura minimicen la intra-cluster y tenga máxima cobertura Max. la similaridad intra-cluster y min. la inter-cluster. La minería web se estructura en: descubrimiento de recursos, extracción de información,... generalización, difusión y validación análisis, validación e interpretación generalización y análisis, validación e interpretación. La minería de uso busca descubrir un modelo a partir de la topología de enlaces extraer información del contenido de los documentos predecir el comportamiento del usuario en la web.
|