Proyecto de Computacion I
![]() |
![]() |
![]() |
Título del Test:![]() Proyecto de Computacion I Descripción: Proyecto de Computacion I |




Comentarios |
---|
NO HAY REGISTROS |
¿Cuál de las siguientes NO es una fase del proceso CRISP-DM para minería de datos?. Comprensión del negocio. Preparación de datos. Modelado. Programación. ¿Qué es ETL en el contexto de minería de datos?. Un tipo de algoritmo de aprendizaje automático. Una técnica de visualización de datos. Un proceso que consiste en extracción, transformación y carga de datos. Un método de evaluación de modelos. ¿Cuál de estas tareas NO es un ejemplo típico de aplicación de minería de datos?. Regresión. Agrupamiento. Predicción de series temporales. Compilación de código. En el aprendizaje supervisado, ¿qué se conoce como "clasificadores"?. Modelos predictivos que asignan datos a clases predefinidas. Algoritmos que identifican patrones ocultos sin clases predefinidas. Técnicas para evaluar la eficiencia de un algoritmo. Métodos para transformar datos en un formato adecuado para el aprendizaje. ¿Cuál es la principal diferencia entre aprendizaje supervisado y no supervisado?. En el aprendizaje supervisado se conocen las clases objetivo de antemano. En el aprendizaje no supervisado se usan modelos predictivos. El aprendizaje supervisado es más eficiente. No hay una diferencia significativa entre ambos tipos. ¿Qué técnica se usa para evaluar la efectividad de un modelo en minería de datos, y no se utiliza en el entrenamiento?. Prueba A/B. Pruebas con datos de entrenamiento. Colecciones de prueba. Análisis de regresión. ¿Cuál de las siguientes NO es una fase de la metodología CRISP-DM?. Comprensión del negocio. Preparación de datos. Modelado. Implementación del algoritmo. En el aprendizaje no supervisado, ¿qué técnica se utiliza para agrupar datos similares?. Clasificación. Regresión. Clustering. Análisis de asociación. ¿Qué algoritmo utilizarías para predecir si un ejemplar pertenece a una de las clases predefinidas?. k-means. Decision Trees. Linear Regression. k-nearest neighbors. Si tu objetivo es predecir un valor numérico para un ejemplar, ¿qué algoritmo elegirías?. Logistic Regression. k-means. Exponential Smoothing. Linear regression. ¿Qué tarea se utiliza para identificar agrupaciones naturales dentro del conjunto de datos?. Detección de Anomalías. Series Temporales. Agrupamiento. Clasificación. ¿Qué algoritmo podrías utilizar para detectar anomalías en un conjunto de datos?. k-means. Local Outlier Factor (LOF). Decision Trees. ARIMA. En la detección de intrusiones en red, ¿qué tipo de tarea se está llevando a cabo?. Clasificación. Detección de Anomalías. series Temporales. Análisis de Asociaciones. ¿Cuál de los siguientes enfoques se utilizaría para encontrar relaciones dentro de un conjunto de datos basado en transacciones?. Apriori algorithm. k-means. Regression. FP-Growth algorithm. ¿Qué algoritmo se utilizaría para predecir la tasa de desempleo para el próximo año?. Decision Trees. Linear Regression. k-means. Local Outlier Factor (LOF). Si quisieras identificar segmentos de clientes dentro de una compañía basándote en sus transacciones, ¿qué técnica utilizarías?. Regresión. Clasificación. Análisis de Asociaciones. Agrupamiento. ¿En qué tipo de análisis se utilizan técnicas como Exponential Smoothing y ARIMA?. Detección de Anomalías. Clasificación. Series Temporales. Análisis de Asociaciones. ¿Qué tarea se utiliza para predecir si una biopsia corresponde a un cáncer maligno?. Clasificación. Agrupamiento. Regresión. Detección de Anomalías. ¿Cuál de los siguientes es un ejemplo de análisis de asociaciones?. Detección de fraude en tarjetas de crédito. Predecir el número de ventas basado en datos históricos. Sugerir productos a clientes basándose en compras previas. Clasificar tipos de cáncer en biopsias. La detección de fraude en operaciones con tarjetas de crédito se puede considerar un caso de: Detección de anomalías. Análisis de Asociaciones. Series Temporales. Agrupamiento. ¿Cuál de los siguientes algoritmos está relacionado con el concepto de agrupamiento?. FP-Growth. k-means. Logistic Regression. Decision Trees. ¿Cuál de las siguientes descripciones corresponde a la regresión logística?. Técnica para detectar anomalías en datos. Modelo predictivo que estima la probabilidad de un resultado binario. Proceso que identifica patrones de comportamiento. Algoritmo que agrupa datos en segmentos. ¿Qué técnica se utiliza para analizar datos de transacciones y encontrar patrones de compra?. Agrupamiento. Clasificación. Detección de Anomalías. Análisis de Asociaciones. Si tienes que predecir la tasa dedesempleo para el próximo año. ¿Que algoritmos usarías?. Linear regression. logistic regression. Decision trees. Distance based. Si tienes que detectar un fraude en operaciones con tarjetas de crédito. ¿Qué algoritmo usarías?. Bayesian model. local outlier factor (LOF). k-means. induction rules. ¿Cuál de las siguientes NO es una característica deseable de los datos abiertos?. Públicos. Estructurados. Propietarios. Actualizados. La Ley de Transparencia en España tiene como objetivo facilitar el acceso público a la información relacionada con actividades públicas o financiadas con dinero público. Verdadero. Falso. ¿Qué formato de archivo se describe como un tipo de documento de texto plano que representa datos tabulados en columnas separadas por un carácter separador?. XML. JSON. CSV. RDF. ¿Cuáles de los siguientes son formatos de archivo comúnmente usados para datos abiertos?. PDF. CSV. XML. JSON. Linked Open Data se refiere a la forma de vincular conjuntos de datos publicados en la web usando URIs, añadiendo contexto y permitiendo acceder a información relacionada. VERDADERO. FALSO. Según el esquema de 5 estrellas de Open Data, ¿qué representa una calificación de 3 estrellas?. Datos publicados en cualquier formato, bajo una licencia abierta. Datos publicados en formato estructurado, usando un tipo de archivo no propietario. Datos publicados en cualquier formato. Datos enlazados con otros datos. ¿Qué concepto va más allá de los datos abiertos y es la base de la web semántica?. Datos públicos. Datos en bruto. Linked Open Data. Datos estructurados. En Pentaho Data Integration, las "transformaciones" se utilizan para procesos ETL complejos, mientras que los "trabajos" son para tareas más simples. Verdadero. Falso. ¿Qué tipo de archivo se utiliza como ejemplo de entrada en el tutorial de Pentaho Data Integration?. Archivo XML. Archivo JSON. Archivo CSV. Archivo de base de datos. Cuáles de los siguientes son operadores disponibles en la interfaz de Pentaho Data Integration para trabajar con datos? (Selecciona todas las que apliquen). Abrir archivos Excel. Transformar datos. Fusionar datos. Limpiar datos. El operador "String cut" en Pentaho Data Integration sirve para eliminar caracteres específicos de un campo de texto. Verdadero. Falso. En el tutorial, ¿qué operador se utiliza para fusionar dos conjuntos de datos basados en una columna común?. Sort rows. Merge Join. Calculator. String cut. Antes de usar el operador Merge Join en Pentaho Data Integration, es necesario ordenar los datos en ambos conjuntos basados en la columna que se utilizará como clave. VERDADERO. FALSO. Pentaho Data Integration permite realizar cálculos numéricos simples utilizando el operador "Calculator". VERDADERO. FALSO. Al iniciar OpenRefine, lo primero que se solicita al usuario es: Seleccionar un algoritmo de limpieza. Cargar un conjunto de datos. Definir el tipo de salida del proceso. Especificar el formato de los datos de entrada. OpenRefine realiza automáticamente la limpieza completa de los datos sin necesidad de intervención del usuario. Verdadero. Falso. La función "Facet" en OpenRefine permite visualizar y filtrar datos basándose en los valores únicos de una columna. Verdadero. Falso. Para transformar una columna de texto que contiene datos numéricos a un formato numérico en OpenRefine, se debe usar: La función "Cluster". La función "Facet". La función "Transform". La función "Edit cells". La función "Cluster" en OpenRefine sirve principalmente para: Transformar datos de un tipo a otro. Agrupar valores similares en una columna. Filtrar datos basándose en un criterio. Crear nuevas columnas de datos. OpenRefine ofrece diferentes algoritmos ("keying functions") para la función "Cluster", permitiendo al usuario elegir el más adecuado para su conjunto de datos. Verdadero. Falso. ¿Cuál de los siguientes algoritmos se menciona en el tutorial para agrupar valores similares en la función "Cluster" de OpenRefine?. ngram-fingerprint. metaphone3. cologne-phonetic. Todos los anteriores. RapidMiner permite construir automáticamente un clasificador sin necesidad de intervención del usuario. Verdadero. Falso. ¿Qué tipo de algoritmo se utiliza para construir un clasificador ?. Regresión logística. Árbol de decisión. Máquina de soporte vectorial. Distance based. ¿Cuál es la función principal del operador Cross Validation en RapidMiner?. Predecir valores futuros. Evaluar el rendimiento de un modelo. Construir un modelo de aprendizaje automático. Limpiar los datos de entrada. El operador Performance (Classification) proporciona métricas como precisión y exactitud para evaluar el rendimiento de un clasificador. Verdadero. Falso. ¿Qué se utiliza para almacenar un modelo entrenado en RapidMiner para su posterior uso?. Decision Tree. Cross Validation. Store. Performance (Classification). RapidMiner permite comparar el rendimiento de diferentes algoritmos de clasificación utilizando el operador Performance. Verdadero. Falso. ¿Qué metacarácter se utiliza para indicar que una coincidencia debe ocurrir al comienzo de una línea?. $. ^. \. |. ¿Cuáles de los siguientes metacaracteres se utilizan para definir alternativas en una expresión regular? (Selecciona todas las opciones que apliquen). (). |. {}. []. ¿Qué metacarácter se utiliza para definir un rango de caracteres en una expresión regular (ej. [a-z])?. (). {}. []. |. ¿Qué metacarácter representa cualquier carácter (comodín) en una expresión regular?. *. ?. . []. ¿Qué metacarácter en una expresión regular indica cero o más repeticiones de un carácter o grupo de caracteres?. +. ?. *. {}. ¿Cuál de las siguientes características NO es propia de Python?. Multiplataforma. Tipado estático. Multiparadigma. Lenguaje de alto nivel. ¿Cuál de las siguientes opciones NO es una forma válida de definir un comentario de una sola línea en Python?. # Este es un comentario. '''Este es un comentario'''. """Este es un comentario""". // Este es un comentario. Si tu objetivo es predecir el número de ventas, ¿qué algoritmo elegirías?. Exponential smoothing. Linear regression. regression. Bayesian models. ¿Cuál de las siguientes variables es válida en Python?. 2variable. _mi_variable. mi variable. for. Selecciona la opción que cumple con las reglas de nombrado de variables en Python: if. validVariable. 9valid. mi variable. ¿Cuál es el resultado? nombre= "Luis" print(nombre + 4). LuisGarcía. Luis García. TypeError: must be str, not int. Luis4. ¿Cuál es el resultado? nombre='Juan' print(nombre*2). Juan. JuanJuan. JJuan. Error. Dada la lista semana_completa = ["lunes", "martes", "miércoles", "jueves", "viernes", "sábado", "domingo"], ¿qué devolverá el siguiente código? print(semana_completa[:3]). ['lunes', 'martes', 'miércoles']. ['martes', 'miércoles', 'jueves']. ['lunes', 'martes', 'jueves']. ['jueves', 'viernes', 'sábado']. ¿Cuál es el resultado de ejecutar el siguiente código? semana_completa ['lunes', 'martes', 'miércoles' ,'jueves', 'viernes', 'sabado', 'domingo'] print(semana_completa[-5,-3]). ['lunes', 'martes', 'miércoles']. ['miércoles', 'jueves', 'viernes']. ['martes', 'miércoles', 'jueves']. ['viernes', 'sábado']. ¿Cuáles de las siguientes son las fases del método CRISP-DM?. Comprensión del negocio, Comprensión de los datos, Preparación de datos, Evaluación, Despliegue. Compresión del negocio, Análisis de datos, Preparación de datos, Modelado, Evaluación, Despliegue,Mantenimiento. Comprensión del negocio, Compresión de datos, Preparación de datos, Modelado, Validación, Despliegue. Comprensión del negocio, Comprensión de los datos, Preparación de datos, Modelado, Evaluación, Despliegue. |