option
Cuestiones
ayuda
daypo
buscar.php

TEMA2GESTIONDATOS

COMENTARIOS ESTADÍSTICAS RÉCORDS
REALIZAR TEST
Título del Test:
TEMA2GESTIONDATOS

Descripción:
todos los cuestionarios del tema2

Fecha de Creación: 2024/01/02

Categoría: Otros

Número Preguntas: 29

Valoración:(0)
COMPARTE EL TEST
Nuevo ComentarioNuevo Comentario
Comentarios
NO HAY REGISTROS
Temario:

El objetivo del Sistema de Gestión de Bases de Datos es seleccionar una estrategia eficiente para resolver una consulta expresada en Algebra Relacional (SQL). V. F.

Los Sistemas de Gestión de Bases de Datos, para calcular el coste de ejecutar una consulta tienen en cuenta: El coste computacional de los algoritmos que implementan las operaciones de Algebra Relacional (AR) en memoria principal y coste de comunicaciones para realizar las distintas operaciones de AR. Los bloques escritos en disco para almacenar el resultado de las distintas operaciones. Los bloques leídos de disco para realizar las distintas operaciones. Los bloques leídos y escritos de disco necesarios para realizar las distintas operaciones de Algebra Relacional.

El factor de bloque: Es el número de columnas de una tabla que caben en un bloque de disco. Es el número de bloques por tupla que admite una tabla. Es el número de filas que entran en un bloque de disco. Es igual para todas las tablas de un esquema. Es el número de filas enteras de una tabla que entran en un bloque de disco.

De las 4 estrategias analizadas en la presentación la mejor opción para resolver la consulta es (ver presentación para saber las estrategias): La estrategia 1, donde se realiza un producto cartesiano porque el producto cartesiano es una operación muy poco costosa. La estrategia 2, donde se realiza la operación reunión entre las dos tablas en primer lugar. La estrategia 3, donde se realiza la operación selección (restricción) en primer lugar y así limita el número de lecturas de bloque para realizar la selección. La estrategia 4 que realiza las operaciones proyección y selección (restricción) en primer lugar consiguiendo los resultados intermedios más pequeños. De esta forma, se realizan menos escrituras y lecturas de bloques de disco.

Es preferible, por lo general, restringir antes de reunir. V. F.

Una reunión entre dos tablas A y B a través de un atributo común ab (A.ab = B.ab), es equivalente (en cuanto al resultado obtenido): a realizar una restricción con la condición A.ab=B.ab y después un producto cartesiano entre A y B. a realizar un producto cartesiano entre A y B, y después restringir aplicando la condición: A.ab=B.ab. a realizar la operación de conjuntos "unión" entre A y B, y después restringir aplicando la condición: A.ab=B.ab. Es equivalente a realizar una proyección con la condición A.ab=B.ab y después un producto cartesiano entre A y B.

En una Base de Datos centralizada el coste de ejecutar una consulta se mide en: número de accesos a disco (inputs/outputs) y bloques enviados. número de bloques leídos. número de accesos a disco (inputs/outputs). número de bloques escritos.

Elige la respuesta correcta: Nota: Para contestar a esta pregunta debes saber que en matématicas se dice que una operación (op) cumple la propiedad conmutativa si: A op B = B op A Si se necesita añadir alguna operación adicional para que se cumpla la igualdad, entonces la operación NO SE CONMUTATIVA. La restricción y la reunión cumplen la propiedad conmutativa. La operación restricción seguida de una proyección es conmutativa, es decir, es igual a projectar y después restringir. La operación reunión entre A y B no es conmutativa, es decir, reunir A con B, no es igual que reunir B con A. La proyección y la reunión no cumplen la propiedad conmutativa.

Para elegir un buen plan de ejecución, el SGBD se apoya en la información estadística existente sobre: columnas de las tablas. tablas, sobre columnas y sus índices. tablas. tablas y columnas de las tablas.

Las reglas de reesctructuración algebraica de árboles se usan para: Realizar las proyecciones en primer lugar junto con las reuniones. Tener un árbol en el que las reuniones se aplican lo antes posible. transformarse las reuniones en producto cartesiano seguido de una restricción. Conseguir un árbol en el que las restricciones y proyecciones se apliquen lo antes posible. Las restricciones se realizarán siempre en primer lugar mientras que las proyecciones se realizarán lo antes posible pero siempre aprovechando otra operación algebraica.

Los SGBDs disponen de algoritmos para implementar la ordenación, necesario cuando (varias respuestas pueden ser correctas): Ninguna de las anteriores. La consulta tiene la cláusula order by. La consulta incluye un DISTINCT. La consulta incluye una restricción.

La selección (restricción) en una tabla se puede realizar (pueden haber varias respuestas correctas): Elija una o más: Utilizando cualquier índice creado sobre cualquier atributo de la tabla implicada en la consulta. Accediendo en primer lugar a los bloques de disco que componen la tabla, y después a un índice de agrupamiento para encontrar las tuplas que cumplen la condición de forma más rápida. Accediendo a un índice (del tipo que sea), existente sobre el atributo implicado en la condición de la restricción, para localizar los bloques de disco con registros que cumplen la condición y, después, leyendo esos bloques del disco. Accediendo secuencialmente a todos los bloques del archivo (leyendo todos sobre bloques).

De las siguientes afirmaciones indica cuales son verdaderas ( puede haber más de una ): Elija una o más: La Reunión es conmutativa con la Restricción. Todas las operaciones de conjuntos (unión, la intersección y el resto) son conmutativas entre los operandos. La Restricción y la Proyección NO son conmutativas entre sí. La proyección es conmutativa con la restricción.

Un índice sobre un atributo K se dice que es de agrupamiento cuando el archivo de datos está ordenado también por el mismo atributo K. V. F.

Un índice es primario cuando se crea sobre un atributo que se clave primaria de la tabla correspondiente. Verdadero. Falso.

Las entradas de índices se pueden organizar (pueden haber varias correctas): Utilizando una función de dispersión, como los índices dispersos. En un sólo nivel,. En varios niveles, como los árboles tipo B+. Nadie es cierto.

upongamos que queremos resolver la consulta: select * from estudiantes where id_estudiante > 29229; Donde existe un índice de dispersión sobre el atributo id_estudiante, que es la clave primaria de la tabla estudiantes. El índice existente sobre la clave primaria no se utilizaría para resolver la restricción, por ser una condición de desigualdad. el índice sobre el atributo id_estudiante se utilizaría para resolver la restricción, por ser un índice de agrupamiento. el índice sobre el atributo id_estudiante se utilizaría siempre, puesto que el acceso con un índice siempre es mejor que sin índice. El índice sobre el atributo id_estudiante se utilizaría para resolver la restricción, por ser un índice primario.

Dato la siguiente relación R ( A, B, C, D, E ) donde TR = 5.000.000 FB = 10 Asumiendo que el tributo A es una clave primaria de R , con valores correlativos entre 0 y 4.999.999 y que R está ordenado según el atributo A, indica cómo se resolvería la siguiente consulta que implica una operación restricción: select * from R where A<> 50.000. Con un índice existente sobre el atributo A que será un árbol árbol B+ de agrupamiento. Con un índice tipo hash. con un índice sobre el atributo A árbol B+, que será de no agrupamiento. Acceso completo a los bloques de datos de la tabla R, pues el índice en este caso no ayuda.

El estadistico ndist(Aa) que denota el número de valores diferentes que existen en un atributo a de la tabla A,. Se puede utilizar en restricciones de igualdad (Aa >= 'valor') para estimar el número de tuplas de la tabla A que van a cumplir la condición, asumiendo uniformidad del atributo Aa (distribución uniforme). Se puede utilizar en restricciones de igualdad (Aa <= 'valor') para estimar el número de tuplas de la tabla A que cumplirán la condición,. Se puede utilizar en restricciones de igualdad (Aa = 'valor') para estimar el número de tuplas de la tabla A que van a cumplir la condición, asumiendo uniformidad del atributo Aa (distribución uniforme). Se puede utilizar en restricciones de igualdad (Aa = 'valor') para calcular de forma exacta el número de tuplas de la tabla A que van a cumplir la condición.

El factor de bloque: Es el número de bloques por tupla que admite una tabla. Es el número de filas enteras de una tabla que entran en un bloque de disco. Es el número de filas que entran en un bloque de disco. Es igual para todas las tablas de un esquema. Es el número de columnas de una tabla que caben en un bloque de disco.

La selección (restricción) en una tabla se puede realizar (pueden haber varias respuestas correctas): Accediendo en primer lugar a los bloques de disco que componen la tabla, y después a un índice de agrupamiento para encontrar las tuplas que cumplen la condición de forma más rápida. Utilizando cualquier índice creado sobre cualquier atributo de la tabla implicada en la consulta. Accediendo secuencialmente a todos los bloques del archivo (leyendo todos sobre bloques). Accediendo a un índice (del tipo que sea), existente sobre el atributo implicado en la condición de la restricción, para localizar los bloques de disco con registros que cumplen la condición y, después, leyendo esos bloques del disco.

Conociendo la fórmula del coste del BNLJ (algoritmo para realizar la reunión) B R + B S * [ B R /B-2], siendo B R el número de bloques que ocupa la relación R y B es el número de bloques que ocupa la relación S. Si tenemos dos tablas con tamaños 1.000 bloques y 10 bloques respectivamente, la tabla R será la tabla que tenga un tamaño mayor (la de tamaño 1000) para minimizar el coste. Supone un buffer B de 3 bloques. v. F.

Supongamos que tenemos las tablas, sobre la que se realiza la reunión natural (revisa el video asociado INLJ) proveedores( v# ,proveedor,estado, ciudad) envíos( v#,p# ,cantidad) select proveedores.* from proveedores pro join envios y donde pro.v#=ev#; Tenemos un índice sobre el atributo envios.v#. La consulta no se puede resolver con el algoritmo INLJ. Se puede en cambio optar por el algoritmo BNLJ. La consulta se puede resolver con el algoritmo INLJ. Se leen los bloques de la tabla proveedores, y para cada tupla en esa tabla se busca en el índice existente sobre el atributo envios.v# y así localizamos los bloques coincidentes en la tabla envios. La única opción para resolver la consulta es el algoritmo SMJ. La consulta se puede resolver con el algoritmo INLJ leyendo en primer lugar los bloques de la tabla envíos, y para cada una de las tuplas accediendo al índice sobre el atributo envios. Luego se accede a la tabla proveedoras.

Supongamos las siguientes tablas. Pedido(y dpedido , idcliente ,fechapedido,entregado) Cliente(y dcliente , número,cogido,email) donde Pedido.idcliente se Clave Ajena en Pedido con referencia a Cliente. Registros en pedido = 50.000 filas Registros en cliente = 1000 filas La siguiente consulta: select pedido.*,cliente.* from Pedido pe join Cliente cli on pe.idcliente =cli.idcliente; El factor de selectividad de la reunión es: Da igual 1/1000 por lo que se estimaría que la reunión daría como resultado una tabla de 1.000 filas. Da igual 1/50.000 por lo que se estimaría que la reunión daría como resultado una tabla de 5.000. Da igual 1/1000 por lo que la reunión daría una tabla de 50.000 filas. Da igual 1/50.000 por lo que se estimaría que la reunión daría como resultado una tabla de 1.000 filas.

Si se tiene una columna Salario en la tabla Empleados donde el número de valores distinguidos de salario es 20, el máximo es 4.500 y el mínimo es 1.200. Empleados( idempleado , número, cogido, email, fechacontrato, Salario) Si se quiere resolver la consulta en SQL: select * from Empleados where Salario>2500; ¿Cuál es el factor de selectividad de la restricción con condición Salario>2500 ?. No se puede calcular con estas datos. el factor de selectividad se 0,05. el factor de slectividad se 0,39. el factor de selectividad se 0,61.

La evaluación de consultas en sistemas distribuidos. debe tener en cuenta el coste de computación en todos los lugares, al ser lo más costoso. debe tener en cuenta el coste de enviar bloques de datos un sitio a otro. Es necesario tener réplicas de todas las datos en los distintos lugares. debe tener en cuenta el copiar todos los bloques implicados en un sitio centralizado.

Existen varias estrategias para el particionado de datos, entre las que están (puede haber varias correctas): Particionado tipo Robin Hood. Particionado por dispersión (hash). Particionado por rango. Particionado por concentración.

Para poder evaluar/optimizar consultas en paralelo. Se puede evaluar de forma paralela cada una de las operaciones implicadas. Se puede evaluar las diferentes operaciones en el árbol en paralelo. Se puede evaluar las diferentes operaciones en el árbol en paralelo y/o evaluar de forma paralela cada operación. Nadie es correcta.

Las bases de datos distribuidas pueden ser (varias respuestas pueden ser correctas): Heterógeneas: diferentes sitios tienen diferentes SGBDs. Homogéneas: en cada sitio corre un SGBDs diferente. Homogéneas: en cada sitio corre un mismo SGBDs. Heterogéneas: en todos corre el mismo SGBD.

Denunciar Test