Big Data parcial 1°
|
|
Título del Test:
![]() Big Data parcial 1° Descripción: parcial en base a preguntero (Materia Electiva) |



| Comentarios |
|---|
NO HAY REGISTROS |
|
(1.1.6) Seleccione las 3(tres) opciones correctas. Una empresa de logística está implementando una solución Big Data. ¿Cuáles de los siguientes perfiles profesionales deben intervenir para una solución Big Data en la empresa de logística?. Un arquitecto de datos porque definirá la estructura de organización y funcionamiento de la solución Big Data. Un científico de datos, porque es necesario a la hora de extraer conocimiento e información útil de los datos proporcionados. Un Data Steward (administrador de datos), porque será quien mantenga la calidad, la seguridad y la disponibilidad de los datos. Un analista de redes tradicionales, porque será el encargado de configurar el cableado físico de las computadoras de la empresa. (1.1.1) ¿Cuáles de las siguientes corresponden al concepto de “Las 4 V” de “Big Data”? Selecciones las 4(cuatro) opciones correctas. Velocidad. Volumen. Variedad. Valor. Virtualidad. Visibilidad. (1.1.1) Selecciones las 2(dos) opciones correctas. En una empresa de productos electrónicos, se está analizando la implementación de tecnología Big Data. ¿Cuáles son las principales ventajas que se obtendrían?. Análisis de operaciones, porque la empresa podrá analizar sus transacciones en mejor tiempo y de manera más eficaz. Visión 360° del cliente, porque le permitirá tener más información sobre sus clientes. Reducción de personal, porque la inteligencia artificial reemplazará a los analistas de datos. Creación de hardware, porque permitirá fabricar nuevos dispositivos electrónicos más rápido. (1.1.4) Seleccione las 4 (cuatro) respuestas correctas. Una compañía de transporte contrata los servicios de un Administrador de datos; quien dice que para asegurar la buena calidad en los datos deben cumplir con ciertas características. ¿Cuáles son?. Consistencia: deben ser datos que al cruzarse con otros no pierdan su esencia, es decir, deben ser consistentes. Exactitud: no podemos dudar si son datos correctos o no, deben ser exactos. Completitud: porque, aunque en este momento sea irrelevante cierta parte del dato, en algún momento …. Conformidad: porque los datos que obtenga la empresa, deben estar en un formato estandarizado y legible para su comprensión. Volatilidad: porque los datos deben poder eliminarse rápidamente si no son útiles. Subjetividad: porque los datos deben interpretarse según el punto de vista del analista. (1.1.6) Teniendo en cuenta los perfiles profesionales de Big Data, estos son: Seleccione las 4 (cuatro) respuestas correctas: (son 7 opciones correctas). Estrategas de datos (data strategist). Business Data Analyst (analista de datos). Data Steward (administrador de datos). Data Engineer (ingeniero de datos). Chief Data Officer (CDO). Data Scientists (científico de los datos). Citizen Data Scientist (ciudadano científico de datos). Administrador de redes (Network Administrator). Diseñador gráfico de datos (Data Graphic Designer). (1.1.6) Teniendo en cuenta los perfiles profesionales de Big Data, estos son: Seleccione las 4 (cuatro) respuestas correctas. Analistas de datos (data analyst). Científico de datos (data scientist). Estrategas de datos (data strategist). Arquitecto de datos (data architect). Programador web (web developer). Especialista en hardware (hardware specialist). (1.2) Selecciones las 4(cuatro) respuestas correctas. La compañía de marketing MKT y Cía., debe comenzar a nutrir la laguna de datos. ¿Cuáles pueden ser las fuentes de datos desde donde tomar los datos?. Web y medios sociales, porque abarca datos generados en la internet y en las redes sociales de las personas. Transacciones, porque tienen información de operaciones monetarias, telefónicas, etcétera. Machine to Machine (M2M), porque implican datos capturados por dispositivos que son retransmitidos a otros a través de redes. Datos biométricos, porque tienen información de las personas que es perfecta. Datos impresos, porque los documentos en papel son la principal fuente de análisis rápido. Televisión analógica, porque transmite señales electromagnéticas útiles para Big Data. (1.2.2) Seleccione las 4 respuestas correctas. Teniendo en cuenta los 5 tipos de datos definidos para Big Data, estos pueden ser: Datos Biométricos. Web y Medios sociales. Máquina-a-Maquina. Transacciones. Datos meteorológicos analógicos. Libros de contabilidad físicos. (1.2.2) Seleccione las 4 respuestas correctas. Teniendo en cuenta los 5 tipos de datos definidos para Big Data, estos pueden ser: (son 5 respuestas correctas). Datos generados por humano. Máquina-a-Maquina. Grandes datos transaccionales. Datos Biométricos. Web y Medios sociales. Encuestas telefónicas en cinta casete. Registros notariales en papel impreso. (1.2.4) Selecciones las 2(dos) respuestas correctas. El área de atención al cliente, recibe reclamos por mail y a través del call center. Si quisiéramos analizar los dos tipos de datos que estas variables representan, diríamos que son: Datos estructurados, porque tienen un formato fijo y preestablecido. No estructurados, porque no tienen un formato determinado y pueden ingresar de cualquier forma. Datos cuánticos, porque pueden estar en múltiples estados al mismo tiempo. Datos invisibles, porque no se pueden almacenar en ningún tipo de base de datos. (2.2.2) Identifique 2 características principales de los sistemas transaccionales. Generan datos de operaciones y actividades rutinarias. Brindan soporte a las operaciones y transacciones diarias. Están diseñados exclusivamente para el análisis predictivo a largo plazo. Almacenan únicamente datos no estructurados provenientes de redes sociales. (2.3.1) ¿Cuáles son los componentes de Hadoop? Seleccione las dos respuestas correctas: MapReduce. HDFS. SQL Server. Microsoft Excel. (2.3.1) ¿Qué componentes forman parte del ecosistema de Hadoop? Seleccione las 4 correctas: Hive. Hbase. Zookeeper. Sqoop. Windows Defender. Adobe Photoshop. (2.3.2) Estas a cargo del monitoreo del proceso ETL. ¿Qué anomalías típicas podemos encontrar? Seleccione las 4(cuatro) respuestas correctas. Al corregir el ETL puedo encontrarme valores nulos. Al corregir el ETL puedo encontrarme con una longitud inconsistente de campos. Al corregir el ETL puedo encontrarme distintas codificaciones para un mismo termino. Al corregir el ETL puedo encontrarme con una descripción inconsistente de campos. Al corregir el ETL puedo encontrarme con que el disco duro físico se ha derretido. Al corregir el ETL puedo encontrarme con virus troyanos en la red corporativa. (2.3.3) ¿Cuáles son las anomalías típicas que se encarga de corregir el ETL? Seleccione las 4 (cuatro) respuestas correctas. Valores nulos. Longitud inconsistente de datos. Descripción inconsistente de datos. Distintas codificaciones para el mismo termino. Direcciones IP duplicadas en el servidor. Errores de sintaxis en el código fuente de la página web. (1.1.5) Selecciones las 2 respuestas correctas. De acuerdo a su organización ¿Cómo pueden categorizarse los datos?. Estructurados, semi estructurados (multiestructurados). No estructurados. Datos volátiles y permanentes. Datos físicos e impresos. (1.1.5) El arquitecto de datos de una compañía de telefonía definió la arquitectura con la que se implementara big data, ¿Cuáles son los componentes principales? seleccione las 4 opciones correctas: transaccionales. laguna de datos. data warehouse. staing. ETL. Sistemas operativos móviles. (1.2.2) En un proyecto de tipo Audiovisual ¿Cuáles son los principales canales de comunicación que permiten obtener datos de usuarios?. Página web o site de la empresa, producto o contenido específico. Redes sociales. Aplicaciones. Transmisiones de radio tradicional. (2.3.3) ¿Cuáles son las técnicas de carga de datos más comunes en un proceso ETL? seleccione las 4 opciones correctas: Cargas secuenciales. Procesos por lotes (Batch). Procesamiento paralelo. Técnicas incrementales. Cargas analógicas manuales. Procesamiento de datos cuánticos. (2.3.3) Tienes que desarrollar el proceso ETL de la compañía. Seleccione las 3 (tres) opciones correctas. Transformación de datos, porque el proceso ETL permite reformatear y limpiar datos antes de cargarlos a otra base de datos. Carga de datos, porque el proceso ETL permite mover datos de una fuente para cargarlos en otra. Extracción de datos, porque el proceso ETL permite mover datos de una fuente a otra. Eliminación de datos, porque el proceso ETL purga y destruye bases de datos antiguas. (2.4.2) ¿Para qué puede ser usada la información o conocimiento que se obtiene al emplear técnicas de minería de datos? Seleccione las 4 (cuatro) respuestas correctas. Aumentar los ingresos. Reducir los riesgos. Mejorar las relaciones con los clientes. Reducir los costos. Aumentar la redundancia de los servidores físicos. Disminuir la seguridad de las redes corporativas. (2.4.3) ¿Cuáles son las etapas del proceso de descubrimiento de conocimiento o KDD? Seleccione las 4 (cuatro) respuestas correctas. Selección de datos. Procesamiento de datos. Transformación de datos. Minería de datos. Instalación de hardware. Ensamblaje de servidores. (2.4.3) Cuando hablamos del proceso KDD nos referimos al proceso de identificar ptarones válidos, novedosos, potencialmente útiles y entendibles. Identifica las cuatro etapas principales por los que pasan los datos. Seleccione 4(cuatro) opciones correctas: Datos seleccionados. Datos. Datos procesados. Datos transformados. Datos ofuscados. Datos corrompidos. (1.1.1) En un proyecto de Big Data ¿Qué datos aportan valor al negocio?. Los datos que permiten obtener información útil para la toma de decisiones de un determinado negocio son los que aportan valor. Los datos que se almacenan temporalmente en la memoria RAM y se descartan después de ser leídos. Los datos que provienen únicamente de fuentes impresas y libros contables de la empresa. Los datos que ocupan menos espacio de almacenamiento en los servidores locales de la empresa. (1.1.1) ¿Qué entendemos por Big Data?. Es toda aquella información que no puede ser procesada o analizada utilizando procesos o herramientas tradicionales. Es un conjunto de datos estructurados que caben perfectamente en una base de datos u hoja de cálculo tradicional. Es toda aquella información que solo puede ser analizada de forma manual por los administradores de redes. Es un hardware diseñado específicamente para crear bases de datos relacionales pequeñas. (1.1.1) Una característica de Big Data es que: Permite realizar analística de los datos. Impide el uso de sistemas en la nube por problemas de ciberseguridad. Solo funciona con datos numéricos y estructurados para las finanzas. Elimina por completo la necesidad de tomar decisiones dentro de la empresa. (1.1.1) Eres un consultor de Big Data en la empresa y el director, te pide que le especifiques que ventaja obtiene aplicando este tipo de tecnología si tenemos en cuenta la velocidad de los datos ¿Qué responderías?. Para la empresa, la velocidad de los datos será ventajosa para la toma de decisiones. Para la empresa, la velocidad de los datos será ventajosa para reducir el espacio físico de sus oficinas. Para la empresa, la velocidad de los datos permitirá que los servidores consuman menos energía eléctrica. Para la empresa, la velocidad de los datos reemplazará por completo al departamento de recursos humanos. (1.1.1) ¿Qué aporta a las empresas la implementación de mejoras tecnológicas producto de una estrategia de Big Data?. Permite descubrir las necesidades y puntos a mejorar en la compañía. Permite ocultar las fallas operativas frente a los competidores directos del mercado. Obliga a las empresas a cambiar radicalmente su rubro de negocio en pocos meses. Garantiza que las ventas se tripliquen de inmediato sin importar el contexto del mercado. (1.1.2) ¿Qué aporta a las empresas la implementación de mejoras tecnológicas producto de una estrategia de Big Data?. Posibilitan la adquisición de datos y permiten descubrir las necesidades y puntos de mejora en la compañía. Posibilitan la eliminación de todos los datos antiguos para ahorrar costos masivos de servidores. Permiten que las empresas dejen de depender de clientes humanos para generar ingresos a largo plazo. Obligan a centralizar absolutamente toda la información en un solo disco duro físico. (1.1.2) En los sistemas transaccionales de una empresa, ¿Qué tipo de datos podemos encontrar?. Datos estructurados. Datos no estructurados. Datos analógicos. Datos cuánticos. (1.1.2) ¿Qué aporta a las organizaciones un rol más activo y social por parte del usuario de las nuevas tecnologías?. Un ecosistema proclive al Intercambio de Información. Un ecosistema aislado donde la información se mantiene estática y reservada. Una reducción drástica en la cantidad de datos generados por los clientes. Una pérdida total de la privacidad y el cierre masivo de cuentas sociales por parte de la empresa. (1.1.2) Indique qué solicitudes se pueden resolver utilizando Data Mining: (seleccione la opción correcta). Encontrar patrones ocultos y repetitivos. Crear hardware de almacenamiento más potente y económico. Instalar sistemas operativos más ligeros en los servidores nuevos. Diseñar la interfaz gráfica y visual de una página web. (1.1.2) ¿Qué motivo a que Big Data se convierta en una tendencia en la actualidad?. Las empresas se dan cuenta de que no pueden analizar, ni manejar la información de manera convencional. Los gobiernos mundiales prohibieron el uso de bases de datos relacionales tradicionales. El internet dejó de funcionar de manera global, obligando a las empresas a usar redes locales. Las computadoras redujeron su capacidad de procesamiento y almacenamiento en la última década. (1.1.2) Estas a cargo de un proceso ETL para carga de datos en la laguna de datos, ahora, ¿Cuáles son los objetivos que deberías tener en cuenta en la fase de transformación de datos? Seleccione la opción correcta. Debo detectar y corregir inconsistencias, porque en esta etapa se limpian los datos mediante algoritmos avanzados. Debo eliminar la base de datos por completo, porque en esta etapa se renueva toda la información desde cero. Debo generar nuevos datos de manera aleatoria, porque la laguna de datos debe estar siempre llena a su máxima capacidad. Debo enviar los datos a imprimir, porque en esta etapa se archivan físicamente todos los registros de la empresa. (1.1.3) Desde las perspectivas del marketing y la publicidad ¿por qué el Big Data ofrece un alto índice de impacto?. Porque los productos ofrecidos por las empresas podrían estar hechos a medida, gracias a la categorización de perfiles. Porque permite que los comerciales de televisión sean transmitidos en mucha mayor resolución. Porque obliga a los clientes a comprar productos incluso cuando no tienen los fondos necesarios. Porque elimina por completo la necesidad de hacer publicidad en redes sociales o páginas web. (1.1.3) Qué aporta a las organizaciones un rol más activo y social por parte del usuario de las nuevas tecnologías?. Un ecosistema proclive al intercambio de información. Un sistema cerrado y protegido exclusivamente para información confidencial. Una disminución drástica en las bases de datos transaccionales diarias. Un ecosistema donde los usuarios prefieren no interactuar jamás con las marcas. (1.1.3) ¿Cuál es el objetivo general de la Inteligencia de Negocios o Business Intelligence?. La toma de decisiones. La creación de virus informáticos. La instalación de servidores físicos. El diseño gráfico de las bases de datos. (1.1.3) Cuando hablamos de la característica “volumen” en Big Data, ¿Cuál es la visión respecto a la unidad de los datos?. Algunos datos no serán útiles por falta de calidad o porque no forman parte de la estrategia de análisis. Todos los datos recopilados son siempre perfectos y se utilizan inmediatamente para el análisis. El volumen no importa en absoluto porque todos los datos se comprimen a un tamaño mínimo casi invisible. Solo se guardan los datos generados en la última hora, mientras que el resto se elimina automáticamente del servidor. (1.1.4) Respecto a la característica VERACIDAD en Big Data ¿A que hace referencia?. A la calidad de los datos que se utilizan para el análisis. A la velocidad a la que se transfieren los datos a través de una red local. Al espacio físico que ocupan los servidores de bases de datos de la empresa. A la cantidad masiva de datos generados por los usuarios en cada segundo. (1.1.4) Una empresa de telefonía tiene implementada una laguna de datos, y necesita cargar los datos en esta laguna. De acuerdo a los perfiles profesionales al manejo de datos, ¿Qué perfil deberían contratar para que se encargue de tareas relacionadas al almacenaje, extracción y movimiento de datos?. Deberían contratar a un arquitecto de datos ya que realiza tareas de almacenaje, extracción y movimientos de datos para cargar datos a la laguna. Deberían contratar a un científico de datos ya que es el único capaz de instalar los servidores físicos de la empresa. Deberían contratar a un administrador de redes ya que su rol principal es analizar los datos estadísticos y matemáticos. Deberían contratar a un programador web para que diseñe la interfaz gráfica de la laguna de datos. (1.1.4) Cuando hablamos de la característica volumen en big data. ¿Cuál es la visión con respecto a la unidad de los datos?. Algunos datos no serán útiles por falta de calidad o porque no forman parte de la estratégica de análisis. El cien por ciento de los datos recolectados siempre tiene un uso estratégico inmediato en la toma de decisiones. El volumen hace referencia únicamente a los datos impresos que la empresa archiva anualmente en sus oficinas. Se deben eliminar todos los datos almacenados después de 24 horas para reducir el volumen total de forma obligatoria. (1.1.4) Respecto a la velocidad en Big Data, ¿Qué factor/es de negocio se encuentra estrechamente ligado/s a esta característica?. La toma de decisiones. El mantenimiento preventivo de las computadoras. La contratación de empleados para el área de limpieza. El diseño de la identidad visual y el logo de la marca. (1.1.5) ¿A qué hacemos referencia cuando nos referimos a un error de tipo Sintáctico en los datos?. Información que, escrita de diferente manera, puede ser igualmente válida. Información que se pierde permanentemente debido a un fallo eléctrico en el disco duro. Datos que han sido infectados por un virus informático antes de iniciar el proceso ETL. Errores generados exclusivamente por la mala calidad del cableado de red de la compañía. (1.1.5) ¿A qué hacemos referencia cuando nos referimos a un tipo de error semántico en los datos?. Es un error que se produce en el contenido de los datos. Es un error relacionado únicamente con el formato de la extensión de un archivo informático. Es un fallo de seguridad cibernética que permite el robo masivo de la información almacenada. Es un error provocado por la falta de memoria RAM en el servidor central. (1.1.5) Estas a cargo de un proceso ETL en una empresa para ingestar datos en la laguna de datos, ahora, ¿Cuál sería tu tarea?. Extract, Transform and Load que implica un proceso estandarizado de extracción, transformación y carga de datos. Eliminar, Trasladar y Liberar que implica vaciar los servidores antiguos para ahorrar espacio de almacenamiento. Enviar, Transmitir y Leer que implica mandar correos electrónicos automáticos masivos a los clientes. Evaluar, Testear y Limitar que implica reducir el ancho de banda y la velocidad de descarga de la empresa. (1.1.5) ¿Cuál es el significado de las siglas en ingles ETL?. Extract, Transform and Load. Execute, Transfer and Lock. Erase, Test and Link. Export, Type and Learn. (1.1.5) ¿Qué tipo de datos nos provee un archivo de Word para su aplicación en Big Data?. No estructurados. Completamente estructurados. Datos numéricos secuenciales. Transaccionales de alta velocidad. (1.1.5) El área Stagin, ¿Qué tipo de información almacena?. Información detallada. Únicamente videos de alta resolución y archivos musicales. Datos corruptos que ya han sido eliminados de la papelera de reciclaje. Información resumida exclusivamente mediante gráficos de torta y barras. (1.1.5) ¿Qué valoraciones aparecen como primordiales en la fase de carga de datos en los procesos ETL?. Destino y nivel de detalle de los datos. El color y la fuente del texto con el que se visualizará la base de datos. La marca del microprocesador del servidor físico donde se alojan. El idioma nativo en el que está programado el sistema operativo del cliente. (1.1.5) ¿Cuál es el objetivo de la fase de transformación de los datos en los ETL?. detectar y corregir inconsistencias mediante algoritmos avanzados de limpieza de datos. comprimir los datos en archivos ZIP para que ocupen muchísimo menos espacio en la nube. encriptar absolutamente toda la base de datos para que ningún empleado pueda acceder a ella. transformar archivos de texto básicos en imágenes digitales para presentaciones comerciales. (1.1.6) ¿Cuál es la función del Científico de Datos?. Establecer modelos estadísticos-matemáticos que permitan definir cómo se van a hacer las cosas. Instalar el cableado de red y configurar los routers de conectividad de la oficina. Atender exclusivamente las llamadas del centro de atención al cliente y registrar quejas. Reparar físicamente el hardware defectuoso de los servidores transaccionales. (1.1.6) De acuerdo a los perfiles profesionales relacionados al manejo de datos, ¿Qué perfil se encarga de tareas relacionadas al almacenaje, extracción y movimiento de datos?. Arquitecto de Datos. Diseñador Gráfico de Datos. Abogado de Privacidad de Datos. Gerente de Recursos Humanos. (1.1.6) De acuerdo a los perfiles profesionales relacionados al manejo de datos, ¿Qué conocimiento engloba un centro de datos?. Computación, matemática y estadística. Psicología conductual, literatura clásica y arte moderno. Arquitectura civil, geografía física y química aplicada. Periodismo de investigación, diseño gráfico y edición de video. (1.1.6) De acuerdo a los perfiles profesionales relacionados al manejo de datos, ¿Qué conocimientos engloba un Científico de Datos?. Computación, matemática y estadística. Diseño gráfico, animación 3D y edición de video. Leyes internacionales, contabilidad y recursos humanos. Mantenimiento de hardware, refrigeración de servidores y electricidad. (1.1.6) En una editorial de periódicos están necesitando perfeccionar la cantidad de copias de periódicos que imprimen. Tienen un detalle de las cantidades que día a día se emiten, creen que es conveniente contratar un científico de datos para realizar esta tarea esto es: Verdadero. Falso. (1.1.6) Desde la academia. están motivando la generación de científicos de datos. ¿qué conocimiento deberían enseñar a los futuros científicos de datos? Seleccione la opción correcta. Computación, matemática y estadística, porque la propuesta de un científico de datos es multidisciplinaria. Exclusivamente lenguajes de programación obsoletos, porque forman la base fundamental de la informática. Únicamente diseño de interfaces gráficas, porque el usuario final es lo más importante en los proyectos de Big Data. Ensamblaje de microprocesadores y reparación de discos duros para servidores locales de gran envergadura. (1.1.6) “En la actualidad, comienza a denotarse una gran demanda de perfiles profesionales que sepa trabajar con datos, y a su vez existe una gran cantidad de recursos humanos formados en estas nuevas tecnologías, como por ejemplo los científicos de datos”. Verdadero. Falso. (1.2) Indique cuales de las siguientes preguntas puede resolverse con Data Mining. ¿Cuál es el perfil de los clientes que probablemente respondan a la futura campaña?. ¿Cuál es la marca de cable de fibra óptica más económica del mercado actual para servidores?. ¿Cómo se instala físicamente el sistema operativo en una computadora de la empresa?. ¿Qué color de pintura de oficina aumenta más la productividad visual del departamento de marketing?. (1.2) Una empresa quiere incorporar Big Data a su compañía, pero no está del todo convencida de realizar esta inversión. Entonces, te contratan para asesorarlos. ¿Qué motivó a que Big Data se convirtiera en una tendencia en la actualidad y podríamos decir que a esta empresa en particular?. La empresa se da cuenta que no puede almacenar, ni manejar la información de manera convencional. La empresa se da cuenta que sus empleados ya no quieren usar computadoras en el espacio de trabajo. La empresa descubrió que el almacenamiento físico en papel es mucho más seguro, ecológico y rápido. Los gobiernos mundiales obligaron por ley a todas las corporaciones a usar Big Data sin importar su tamaño. (1.2.1) En un proyecto de tipo Audiovisual, ¿Cuáles son los principales canales de comunicación que permiten obtener datos de usuarios? Seleccione la opción correcta. Página Web, Redes Sociales y Aplicaciones. Carteles en la vía pública, folletos impresos y revistas de papel especializadas. Transmisiones de radio AM, televisión analógica tradicional y envíos por telégrafo. Únicamente encuestas de satisfacción telefónicas realizadas a líneas fijas domiciliarias. (1.2.1) ¿Cuáles son las características que debe tener un KPI para ser de utilidad?. cuantificable, inequívoco y realizable. subjetivo, inalcanzable y completamente ambiguo. invisible para los empleados, aleatorio y temporalmente infinito. puramente narrativo, extenso en su descripción y filosófico. (1.2.1) “social big data es una tendencia que aparece gracias a la creciente participación de los usuarios” ……esto es: Verdadero. Falso. (1.2.1) ¿de qué manera las empresas pueden recrear sus modelos de negocios a partir de datos capturados ……. Vincular la actividad de las personas en la red con sus perfiles de usuario. Ignorar por completo la huella digital del cliente y basarse exclusivamente en encuestas impresas a mano. Eliminar masivamente todos los perfiles de usuario cada 24 horas para proteger el almacenamiento del servidor. Desconectar los servidores de internet para evitar que los datos capturados se actualicen en tiempo real. (1.2.2) En el contexto de Analítica de Marketing ¿Cuál es el significado de Real Time Bidding (RTB)?. Ubicar publicidad en la web en el tiempo real. Imprimir folletos publicitarios masivos a través de impresoras 3D en cuestión de segundos. Bloquear automáticamente y en tiempo real todas las publicidades en los navegadores de los competidores. Enviar cartas físicas y cupones a los domicilios de los clientes mediante servicio de correo postal. (1.2.2) La empresa Analytics está trabajando en la fase de carga de datos en el proceso ETL. ¿Qué valoraciones primordiales deberían tener, estando en la fase de carga de datos? Seleccione la opción correcta. La empresa Analytics debería tener como valoraciones primordiales el destino y nivel de detalle de los datos. La empresa Analytics debería tener como valoración primordial la estética visual y el color de la interfaz de la base. La empresa Analytics debería valorar únicamente el costo de la electricidad consumida por los servidores en la nube. La empresa Analytics debería priorizar la destrucción y eliminación inmediata de todos los datos transaccionales. (1.2.3) Teniendo en cuenta las fases de un proyecto audiovisual, en que fase/s el publico puede participar con acciones comunicativas que generan datos?. Distribución comercial. Escritura del guion inicial en las oficinas creativas. Grabación técnica en el set de filmación a puertas cerradas. Edición de color y montaje offline del video en el estudio. (1.2.3) Un reconocido estudio de abogados necesita almacenar sus documentos para comenzar a hacer un análisis de sus casos, los tiempos de resolución, la distribución de sus socios, etcétera. Todo el material disponible se encuentra en un archivo formato Word. Te piden que analices los datos, ¿Qué formato dirías que tienen?. El Word nos brinda datos no estructurados ya que son datos sin un orden claro. El Word nos brinda datos perfectamente estructurados y listos para inyectarse en un almacén de datos relacional. El Word nos brinda datos de tipo transaccional puro con una altísima velocidad de generación de operaciones. El Word nos brinda datos biométricos complejos que son generados automáticamente por máquinas inteligentes. (1.2.3) ¿Por qué los smartphones son una fuente de datos valiosa para las empresas que nos ofrecen aplicaciones gratuitas?. Porque para interactuar con aplicaciones previamente tenemos que identificarnos con un usuario, y ello permite crear perfiles personales y recopilar hábitos de consumo. Porque los smartphones pueden imprimir de forma automática informes financieros en papel para el uso directo de las corporaciones. Porque permiten a las empresas utilizar remotamente la batería del teléfono y su procesador para minar criptomonedas sin permiso. Porque en realidad las aplicaciones gratuitas nunca recopilan datos, simplemente exigen conexión a internet para mostrar publicidad estática. (1.2.3) Estas a cargo del armado de los ETL para la ingesta de datos en la laguna de datos. ¿de dónde obtienen las organizaciones información de interés para la toma de decisiones?. De sus sistemas corporativos, de sistemas de información de terceros, de redes sociales, de los dispositivos móviles de sus clientes y de dispositivos pertenecientes al internet de las cosas. Solo de sus sistemas corporativos tradicionales porque son las únicas fuentes seguras. Exclusivamente de redes sociales, ya que los sistemas de información de terceros no son legales. Solamente de registros escritos a mano almacenados en los archivos de recursos humanos. (1.2.3) Una organización está interesada en incorporar Big Data para mejorar en varios aspectos su desempeño en el mercado. Entonces, te consultan respecto a las ventajas de este tipo de soluciones para la toma de decisiones. ¿Qué podrías decir respecto a los datos y las nuevas tecnologías de Big Data, con respecto a los sistemas de toma de decisiones tradicionales?. “El análisis de datos no estructurados es una ventaja de las nuevas tecnologías de Big Data, porque siempre han sido difíciles de gestionar para los sistemas tradicionales”. “La desventaja de Big Data es que solo puede procesar información que ya fue analizada por los sistemas tradicionales”. “El análisis de datos estructurados es la única ventaja de Big Data, ya que los datos no estructurados no se pueden procesar nunca”. “Big Data obliga a las organizaciones a destruir sus sistemas de decisiones tradicionales para poder instalar la laguna de datos”. (1.2.4) “He observado diferencias de tipo sintácticas en los datos, a la hora de migrarlos desde las fuentes de data lake (laguna de datos)”. Esto dijo el encargado de migrar los datos ¿A qué está haciendo referencia?. Está haciendo referencia a que hay información escrita de diferente manera, pero que puede ser igualmente valida. Está haciendo referencia a que los datos han sido borrados por completo del sistema. Está haciendo referencia a un error fatal en el hardware que impide que el servidor encienda. Está haciendo referencia a la imposibilidad de conectar la computadora a la red Wi-Fi. (2.1.1) ¿Cómo se llama el enfoque de almacenamiento de datos que crea, primero el Almacén de datos central completo, y después los data marts para grupos específicos de usuarios?. Enfoque de arriba hacia abajo. Enfoque de abajo hacia arriba. Enfoque lateral centralizado. Enfoque de transacciones múltiples. (2.1.1) En los procesos ETL, se llevan los datos desde las distintas fuentes de datos a un Staging ¿Cuál es el objetivo de las técnicas de almacenamiento de datos?. Integrar la información procedente de distintas fuentes de datos para la toma de decisiones. Separar la información para que cada departamento de la empresa trabaje de forma completamente aislada. Eliminar sistemáticamente los datos antiguos para no saturar el almacenamiento de la nube. Crear copias impresas de todos los archivos digitales en caso de un corte de energía masivo. (2.1.1) ¿Cuál es el objetivo del proceso de descubrimiento de conocimiento en bases de datos o KDD?. Extraer conocimiento de datos en el contexto de bases de datos grandes mediante minería de datos. Desarrollar nuevas interfaces gráficas para los sistemas operativos móviles. Ensamblar componentes electrónicos para la creación de nuevos discos duros. Contratar personal capacitado para el área de recursos humanos y finanzas. (2.2.1) ¿Qué es KDD (del ingles Knowledge Discovery in databases)?. Se refiere al amplio proceso de búsqueda de conocimientos en los datos que utiliza métodos de minería de datos. Se refiere al protocolo de seguridad utilizado para evitar hackeos en servidores locales. Es un lenguaje de programación obsoleto que se usaba antes de la existencia de Big Data. Es un hardware especializado en procesar gráficos en computadoras cuánticas. (2.2.1) ¿Cómo se llama el Almacén de datos para satisfacer las necesidades de un departamento o sección dentro de una empresa?. Data mart. Data lake. Sistema Operativo. Archivo ZIP. (2.2.1) Un Data mart dispone de información acerca de toda la empresa, requiere un modelado del negocio complejo y puede llevar años en su construcción e implementación. Falso. Verdadero. (2.2.1) En el modelo Multidimensional ¿Cómo se estructura su diseño?. En Hechos: que son las actividades de interés para la empresa y Dimensiones: que son el contexto sobre el que se desea analizar estas actividades. En Redes: que son las conexiones de internet y Servidores: que almacenan la información local. En Transacciones: que son compras y Ventas: que son los ingresos diarios. En Filas: que no tienen relación alguna con el negocio y Columnas: que se utilizan solo para diseño visual. (2.2.1) ¿Qué significa que un Almacén de datos es variable en el tiempo?. Los datos se cargan con una referencia temporal. Los datos desaparecen automáticamente a medida que pasa el tiempo. El almacén solo puede ser accedido en determinados horarios del día. La velocidad de transferencia de los datos cambia según el clima. . (2.2.1) ¿Qué es un almacén de datos?. Es una colección de datos orientados por tema, integrados, variables en el tiempo y no volátiles que se emplea como apoyo a la toma de decisiones estratégicas. Es un edificio físico donde la empresa guarda sus servidores, cables de red y documentación antigua en cajas. Es una pequeña tabla de Excel diseñada para almacenar contraseñas y correos de los empleados. Es una red social corporativa utilizada únicamente para la comunicación interna entre departamentos. (2.2.1) ¿Qué significa que un Almacén de datos es no volátil?. Los nuevos datos se añaden siempre, de manera periódica, y no se sustituyen los existentes. Significa que solo puede almacenar datos en la memoria RAM y se borra al apagar el equipo. La información se elimina cada 24 horas para garantizar la máxima seguridad informática. Los datos son extremadamente peligrosos y pueden dañar el servidor si no se analizan rápido. (2.2.1) ¿Quién es el responsable de definir el medio de almacenamiento de los datos?. Arquitecto de datos. Analista de marketing. Diseñador UX/UI. Abogado corporativo. (2.2.1) ¿Cuál de las siguientes, es una desventaja de la Almacén de datos Tradicionales?. Tiene un alto costo de infraestructura y almacenan sólo datos estructurados provenientes de sistemas transaccionales. Son gratuitos, pero consumen demasiado ancho de banda de la red Wi-Fi de la compañía. Almacenan demasiados datos no estructurados y se saturan con videos de alta definición. Son muy fáciles de hackear y no permiten la entrada de información de bases de datos relacionales. (2.2.1) ¿A dónde se aloja normalmente un Almacén de datos?. En un servidor de mainframe o en la nube. Únicamente en discos flexibles (floppy disks). Exclusivamente en dispositivos móviles de los empleados. En memorias USB portátiles que se reparten a los gerentes. (2.2.2) Mario debe llevar mediante algún proceso, los datos desde los transaccionales a la Data Warehouse. ¿Con cuál de los siguientes puede hacerlo?. Mario debe trabajar con el proceso ETL, porque es el encargado de llevar los datos desde diferentes fuentes a un almacenamiento. Mario debe usar Data Mining, porque sirve para copiar y pegar información manualmente. Mario debe programar en HTML, porque es el único lenguaje para trasladar grandes volúmenes de datos. Mario debe instalar un disco duro externo en cada computadora de la red para extraer los datos. (2.3.1) ¿Cuáles son las tres capas de las que consta una arquitectura de almacén de datos?. Repositorio de documentos, capa de inteligencia empresarial y el Enterprise Data Warehouse (EDW). Hardware de red, cableado estructurado y sistema operativo. Capa visual, capa de audio y capa de interacción de usuario. Redes sociales, transacciones financieras y encuestas telefónicas. (2.3.1) ¿En qué etapa del ETL se puede procesar una longitud inconsistente de campos?. Transformación. Extracción. Carga. Eliminación. (2.3.1) Eres el analista de BI y te encargan desarrollar un nuevo modelo de datos. En el modelado multidimensional, ¿Cómo se estructuraría tu diseño?. En el modelado multidimensional el diseño se estructuraría en dimensiones y en hechos, porque son las fundamentales para el modelo. En el modelado multidimensional el diseño se estructuraría en píxeles y resoluciones. En el modelado multidimensional el diseño se estructuraría únicamente en textos planos. En el modelado multidimensional el diseño se estructuraría en ondas y frecuencias de radio. (2.3.1) ¿Qué tipo de almacenamiento es que utilizan los sistemas corporativos?. Transaccionales. Experimentales. Fotográficos. Temporales efímeros. (2.3.1) ¿Cómo se puede escalar de una arquitectura de Data Warehouse a una de Data Lake para Big Data?. Incorporando nuevas tecnologías de almacenes de datos como Hadoop, Elasticsearch, para poder lograr variedad y velocidad y disponibilizar la información en el tiempo real. Comprando más discos duros tradicionales y conectándolos mediante cables USB al servidor central. Eliminando todos los datos actuales y empezando desde cero con un bloc de notas digital. Obligando a los empleados a escribir todos los datos de forma manual en hojas de cálculo simples. (2.3.1) ¿Cómo se estructura la arquitectura clásica de un almacén de datos?. Fuentes de datos externas, repositorio de almacén de datos, Metadatos, Herramientas de consulta, Servidores OLAP. Placa base, memoria RAM, tarjeta gráfica y fuente de alimentación. Capa de diseño, capa de animación 3D y renderizado final en tiempo real. Televisión por cable, fibra óptica, satélites de comunicación y antenas repetidoras. (2.3.2) ¿Cuáles son fuentes de datos utilizadas normalmente para extraer los datos que albergará el almacén de datos?. Bases de datos externas, internet, Datos de formato tradicional. Exclusivamente revistas de moda impresas y periódicos locales en papel. Televisores de tubo analógicos y reproductores de VHS. Microondas y electrodomésticos sin conexión a internet. (2.3.3) ¿Cuál es uno de los sujetos de la fase de transformación del ETL?. Detectar y corregir inconsistencias. Desconectar los cables del servidor. Imprimir la base de datos en papel. Infectar la red con virus informáticos. (2.3.3) ¿Cuál es la función del proceso ETL?. Son los responsables de extraer los datos de las fuentes de datos transaccionales, realizar las transformaciones necesarias y cargarlos en el almacén de datos una vez que han sido tratados. Son los encargados de proteger el edificio donde se guardan los servidores físicos de la empresa. Es un departamento de recursos humanos dedicado a contratar programadores expertos en minería de datos. Son programas que eliminan aleatoriamente los datos para que el almacenamiento no se sature. (2.3.4) ¿Cuáles son las herramientas de consulta con las que finalmente se accederá al almacén de datos? Seleccione la opción correcta: Aplicaciones para consultas ad hoc e informes; Aplicaciones de consulta de directivos; Herramientas OLAP; Herramientas de Minería de Datos. Navegadores web tradicionales sin ningún tipo de software adicional. Reproductores de video y software de edición de imágenes. Aplicaciones de mensajería instantánea como WhatsApp y Telegram exclusivamente. (2.3.4) ¿Cuáles son las técnicas de carga de datos más comunes en un proceso ETL?. Cargas secuenciales, procesos por lotes y procesamiento paralelo. Cargas inalámbricas, Bluetooth y conexiones satelitales. Procesamiento fotográfico, escaneo 3D y renderizado de gráficos. Descargas peer-to-peer (P2P), torrents y redes oscuras. (2.4.1) Martin esta por realizar una minería de datos, ¿de qué manera realizara la extracción de información o conocimiento?. Martín lo hará de manera automática. Porque es la única forma posible. Martín lo hará leyendo cada documento en papel de a uno y haciendo resúmenes a mano. Martín deberá adivinar los resultados usando intuición, ya que la minería de datos es subjetiva. Martín tendrá que preguntar telefónicamente a cada cliente para extraer su información. (2.4.1) Tu jefe te consulta en que consiste el proceso de minería de datos ¿Qué le contestarias?. Es el proceso que tiene como objetivo explorar y analizar grandes volúmenes de datos de manera automática o semiautomática para encontrar patrones ocultos y repetitivos que expliquen el comportamiento de los datos y generar modelos predictivos basados en datos. Es un proceso para extraer minerales y metales preciosos utilizando grandes servidores informáticos. Consiste en almacenar copias de seguridad en discos rígidos para evitar pérdidas ante cortes de energía. Es la tarea de diseñar logotipos y material publicitario usando datos matemáticos. (2.4.1) En Minería de Datos, ¿De qué manera se realiza la extracción de información o conocimiento?. De manera automática. Manualmente mediante papel y lápiz. Únicamente por encuestas presenciales en la vía pública. A través de transmisiones de radio de onda corta. (2.4.1) Te postulaste para una vacante de científico de datos en una compañía financiera, ¿Qué es lo que están buscando para esa vacante?. Se trata de una persona formada en las ciencias matemáticas y las estadísticas que domina la programación y sus diferentes leguajes, ciencias de la computación y analítica. Se trata de un abogado experto en leyes internacionales sobre privacidad de redes sociales. Es una persona con conocimientos básicos en Excel que se encarga de atender el call center de la compañía. Buscan un técnico electricista para reparar los enchufes del centro de cómputos. (2.4.3) ¿Cuál es el primer paso del proceso de descubrimiento de conocimiento?. La integración y recopilación de los datos a analizar. La venta de los resultados a una empresa competidora. La eliminación de toda la base de datos existente. La publicación de informes gráficos en revistas de la industria. (2.4.4) ¿Que perfil profesional tiene un alto conocimiento de estadística?. El científico de datos. El administrador de redes sociales. El técnico en hardware. El diseñador gráfico. (2.4.5) A la minería de datos también se la conoce por otros nombres como: extracción de conocimientos, análisis de patrones y datos, machine learning, entre otros. Verdadero. Falso. (2.4.5) Si trabajas como científico de datos y tenes que seleccionar las técnicas mas relevantes de la minería de datos ¿Cuáles seleccionarías?. Aunque dependa de que datos estemos buscando, seleccionaría las técnicas: arboles de decisión, reglas de asociación, canasta de productos, regresión múltiple, y regresión logística entre muchas otras. Seleccionaría el formateo de discos, instalación de sistemas operativos y actualización de antivirus. Utilizaría técnicas de diseño web, marketing de guerrilla y posicionamiento SEO. Me basaría exclusivamente en encuestas telefónicas manuales y entrevistas cara a cara. (2.4.5) Una empresa te contrata para hacer minería de datos ¿Culaes son los dos grupos de técnicas que utilizaría para analizar los datos bajo la minería de datos? Seleccione la opción correcta: Técnicas estadísticas y de inteligencia artificial, porque se busca descubrir grandes patrones o irregularidades en una cantidad determinada de datos. Técnicas artísticas y de literatura, porque los datos deben ser narrados como una historia emotiva. Técnicas manuales y mecánicas, utilizando engranajes y papel perforado. Técnicas de psicoanálisis y psicología conductual para entender emocionalmente a los servidores. (2.4.6) ¿Cuáles son aplicaciones de la Minería de Datos?. Marketing. Análisis de la cesta de la compra. Segmentación de mercados. Análisis de riesgos. Gestión de fraudes. Construcción de edificios. Diseño de indumentaria. Cocina de vanguardia. Reparación de redes eléctricas. Plomería industrial. Ensamblaje de automóviles. Composición musical. Escultura 3D. Pintura al óleo. |





