Test ACII
![]() |
![]() |
![]() |
Título del Test:![]() Test ACII Descripción: Preguntas tipo test examen ACII de la ugr |




Comentarios |
---|
NO HAY REGISTROS |
Cuál de las siguientes afirmaciones es correcta: En una arquitectura homogénea uniforme es más fácil asignar la carga de trabajo. Un tipo de asignación dinámica es la basada en round robin. La funcionalidad es relativa al tiempo que pasa el servicio caído tras un fallo. Un sistema no escalable presenta una eficiencia que tiende a 1. ¿Qué afirmación no se corresponde con el paralelismo de datos?. Se encuentra implícito en las operaciones con estructuras de datos. Se puede extraer de funciones que se ejecutan de forma secuencial. Se utiliza para paralelizar las iteraciones de los bucles. El programador no tiene que ocuparse de la sincronización en ningún caso. Un programa tarda 50 segundos en ejecutarse en un multiprocesador. Durante un 20% de ese tiempo se ha ejecutado en 4 procesadores; durante un 40%, en tres; y durante el 40% restante, en un procesador (consideramos que se ha distribuido la carga de trabajo por igual entre los procesadores que colaboran en la ejecución en cada momento, y despreciando la sobrecarga). ¿Cuál es la ganancia en velocidad? ¿Cuál es la eficiencia?. Ganancia 0.9 y eficiencia 2.6. Ganancia 1 y eficiencia 0.6. Ganancia 2.4 y eficiencia 0.6. Ganancia 2.4 y eficiencia 1.52. Teniendo una imagen a la que se le quiere aplicar un conjunto de acciones secuenciales dependientes en un computador paralelo ¿Qué estructura paralela es mas apropiada?. Divide y vencerás. Segmentada. Descomposición de dominio. Maestro-esclavo. ¿Cuál de las siguientes opciones es una desventaja de un servidor Blade?. Siempre es más caro. Existe una limitación en el número de procesadores. No se pueden intercambiar componentes en caliente. Consumen más energía. ¿Cuál de las siguientes técnicas de conmutación tiene como unidad de transferencia el mensaje?. Virtual Cut-Through. Vermiforme. Conmutación de circuitos. Ninguna de las anteriores. ¿Cúal de las siguientes afirmaciones es correcta?. En arquitecturas UMA el tiempo de acceso de los procesadores tanto a memoria principal como a cache es igual sea cual sea el procesador. NCC-NUMA incorpora hardware para evitar problemas por incoherencias entre caches de distintos nodos. CC-NUMA realiza coherencia entre los módulos de memoria principal y no entre las caches. Los sistemas COMA son más caros y son los menos flexibles en el mantenimiento de la coherencia. Marca la opción verdadera de las siguientes afirmaciones relacionadas con el estilo de programación de variables compartidas. Cada procesador en el sistema tiene su espacio de direcciones propio. Los procesadores en el sistema comparten el mismo espacio de direcciones. Es necesario repartir los datos entre los procesadores que forman la máquina de ejecución. Los datos transferidos a cada procesador están duplicados en memoria principal. En programación paralela, si usas la comunicación por dispersión: Cada receptor recibe un mensaje diferente de una fuente. Todos los receptores reciben el mismo mensaje de una fuente. Cada receptor recibe un mensaje de una fuente diferente. Cada receptor recibe el mismo mensaje de una fuente diferente. Una constelación es: Colección de recurso autónomos distribuidos geográficamente. Cluster con SMP en el que el numero de nodos es menor que el numero de procesadores dentro de un nodo. Cluster con S.O. libre y componentes hardware y software con amplia difusión ofreciendo una buena prestación/precio. Red de computadores paralelos con un número de procesadores mayor que 100. Se ve como una sola maquina. El término enlace hace referencia a: El conjunto formado por canal, controladores de canal y almacenamiento. Cable o medio de interconexión física entre conmutadores. El conjunto formado por canales y controladores de canal. Cable o medio de interconexión física entre conmutadores y estos con las interfaces de red. ¿Cuál de las siguientes clases de computadores paralelos es la más escalable?. NCC-NUMA. CC-NUMA. SMP. COMA. El concepto de productividad global se refiere a: Media de tiempo de transferencia de todos los paquetes generados en un intervalo de tiempo. Número de bits que se están transfiriendo en toda la red en una unidad de tiempo. Tiempo de transferencia total de un mensaje de un tamaño concreto m entre dos nodos cualquiera de la red. Número de bytes enviados por unidad de tiempo entre dos nodos. ¿Cuál de las siguientes afirmaciones es incorrecta?. Cada proceso tiene su propio espacio de direcciones. Las hebras hijas de un mismo proceso no tienen por qué compartir direcciones. Las hebras se crean y se destruyen más rápido que los procesos. La comunicación, sincronización y conmutación entre hebras es más rápida que entre procesos. ¿En una red hipercubo bidireccional de grado 5, podrían producirse interbloqueos entre los nodos de una misma fila o columna si el algoritmo de encaminamiento es siempre mínimo?. Si, las redes hipercubo pueden tener problemas de interbloqueos. No, si el algoritmo de encaminamiento es mínimo, puesto que eso quita los ciclos. No, si todos envían por el camino mínimo, porque la dimensión es impar. Ninguna de las anteriores es cierta. El modelo de consistencia de cualquier sistema debe: Especificar el orden en el que las operaciones de un proceso deben parecer haberse realizado. Especificar el orden en el que las operaciones de acceso a memoria de un proceso deben parecer haberse realizado. Especificar el orden en el que las operaciones de acceso a memoria de un proceso deben realizarse. Ninguna de las anteriores. Un algoritmo de encaminamiento inconsciente: No puede seleccionar el camino para un determinado paquete si no tiene información del estado de la red. Puede proporciona más de un camino para un envio entre el nodo A y el nodo B de una red cualquiera. Tiene una implementación más compleja que un algoritmo que no lo sea. Son totalmente diferentes que los deterministas. En el método de adquisición de un cerrojo se: Accede a la zona de código denominada sección crítica. Se espera a que el cerrojo esté abierto para acceder a la sección crítica. Se liberan los recursos compartidos a los que se había accedido. Se intenta acceder a la zona de código que conforma la sección crítica. En la consistencia secuencial: Cada procesador debe mantener el orden entre las operaciones del código que ejecuta. Cada procesador debe mantener el orden entre operaciones a direcciones comunes. Cada procesador debe mantener el orden entre operaciones de escritura a direcciones comunes. Cada procesador debe mantener el orden entre operaciones de lectura a direcciones comunes. En los modelos relajados de consistencia se pueden encontrar modelos que: Relajen el orden del programa ejecutado en cada procesador. Relajen la atomicidad de las operaciones de lectura o escritura en memoria. Relajen la forma en la que se adquiere el acceso a las secciones críticas. Relajen el orden del programa ejecutado en cada procesador y relajen la atomicidad de las operaciones de lectura o escritura en memoria. En el protocolo de coherencia basado en directorio de Vector de bits asignados a grupos se presenta un inconveniente con respecto al vector de bits completo y es que: El tamaño de la matriz del directorio es mucho menor. El número de nodos que pueden controlar su coherencia con este protocolo está limitado al número de grupos. Se pueden invalidar copias de direcciones que están presentes y siendo usadas por algunos nodos. No tienen ningún inconveniente, todo son ventajas. En el protocolo de coherencia denominado Directorio encadenado tiene una peculiaridad con respecto a los demás protocolos basados en directorios y es que: Es el que menos tamaño de la memoria principal desperdicia. Es el protocolo más escalable en su implementación. Necesita espacio en la memoria principal del nodo propietario del directorio y en las cachés de los procesadores que acceden. Tiene una latencia menor que los demás. En un algoritmo de encaminamiento distribuido con una implementación de tabla de consulta necesitaremos: Más memoria que si su implementación fuera en fuente incluso si el número de nodos es elevado. Acceder a la tabla de consulta para cada salto que el mensaje realiza en la red. No es necesario identificar el destino en el mensaje, ya se sabe desde el origen. No se puede implementar un algoritmo de encaminamiento distribuido por tabla de consulta. En el control de flujo extremo a extremo se pueden asignar las siguientes tareas (Elimina la incorrecta). Asegurar la recepción sin errores de la unidad de datos. Garantizar el almacenamiento en el destino de la unidad de datos. Garantizar unas mínimas prestaciones en la red de interconexión. Arbitrar entre unidades que quieren acceder al mismo recurso simultaneamente. La interfaz de red se debe ocupar de las siguientes funciones (elimina la incorrecta): Almacenamiento a la salida y la entrada de paquetes. Control de flujo a nivel físico. Encaminamiento. Direccionamiento. Indica si la siguiente función es válida para implementar un cerrojo sobre una variable compartida k: Lock(k){ b=1; do { Compare&Swap(0,b,k) while(b = = 1); }. Si, no hay ningún problema en la función. Es válida si la variable b también puede ser vista por todos los procesos que comparten el cerrojo. No es valida porque Compare&Swap no sirve para implementar cerrojos. Ninguna de las anteriores. Las redes estrictamente ortogonales deben cumplir las siguientes premisas (Elimina la incorrecta): Los enlaces conectan dos nodos cuyas posiciones en la red varian en una unidad en una dimensión. Los nodos pertenecientes a la misma fila o columna pueden tener una conexión de realimentación dentro de esa dimensión o no tenerla, es algo no obligatorio. El número de nodos en cada dimensión debe ser el mismo si son mallas estrictamente ortogonales. Los canales que unen los nodos pueden ser unidireccionales o bidireccionales. El ancho de banda efectivo es: Es la productividd a la que se tiende conforme aumenta el tamaño del mensaje. Es el número de bytes enviados por unidad de tiempo entre dos nodos de la red. Es el tiempo de transferencia total de un mensaje de tamaño m. Es la capacidad de transmisión de los canales de la red. Indique cuál de los siguientes programas paralelos presenta mejor escalabilidad: Programa que presenta una isoeficiencia con orden de complejidad de 1/p2. Programa que presenta una isoeficiencia con orden de 1/(p2*log2(p)). Programa que presenta una isoeficiencia con orden de 1/p3. Programa que presenta una isoeficiencia con orden de 1/(p*log2(p)). En el tipo de conmutación Vitual Cut-Through los buffers de almacenamiento a la entrada de los conmutadores tendrán un tamaño que permita almacenar: Al menos un paquete. Al menos un phit. Al menos un flit. Puede ser cualquiera, el tamaño del buffer de entrada no es importante. En un sistema CC-NUMA que conecta 16 nodos se quiere implementar un protocolo basado en directorios con 3 estados en el directorio. Cada nodo tiene 8GB de memoria y 16 MB de memoria cache. Una línea de cache es de 64B ¿Qué porcentaje ocupa la información del subdirectorio en un nodo si se usa una implementación de lista doblemente enlazada?. 0.039. 1.23. 0.45. Ninguna de las anteriores. En el tipo de conmutación (Store and Fordward) el algoritmo de encaminamiento se ejecuta: Cuándo llega la cabecera. Cuándo llega el primer flit que es donde va el destino del mensaje. Cuándo llega el paquete completo. Con este tipo de conmutación no hay algoritmo de encaminamiento. En el control de flujo físico debemos: Garantizar las máximas prestaciones de la red. Asegurar una recepción sin errores de la red. Garantiza que la unidad de información puede almacenarse en el destino. Asegurar que la unidad de información llega al destino. El número de conmutadores en una red bloqueante de an x bn será (i denota el número de etapa): n*a^i*b^i. Σ a^(n−1−i) · b^i. 4·n^i. n^i · 2^(b-1). El ancho de banda teórico o capacidad del canal es: La capacidad de transmisión de los canales de la red. La productividad máxima que permite el sistema de comunicación entre dos nodos. Número de bytes enviados entre dos nodos por unidad de tiempo. Ninguna de las anteriores. Cual es la serie correcta: Paquete, mensaje, phit, flit. Mensaje, paquete, phit, flit. Mensaje, paquete, flit, phit. Ninguna de las tres son correctas porque el mensaje no tiene nada que ver. Un algoritmo determinista presenta las siguientes características (Elimina la incorrecta). Es un algoritmo inconsciente. Ejecuta una función de selección que determina el camino final entre las opciones disponibles. Si hay dos caminos mínimos disponibles el mensaje se enviará por uno aleatorio. Ejecuta una función de encaminamiento que nos dará los caminos posibles. ¿Cuántos caminos mínimos se pueden utilizar para una comunicación entre la fuente número 5 y el destino número 8 conectados por una red de Benes de 16 entradas. 4. 8. 16. 1. Supongamos que tenemos un código con una fracción paralelizable del 80%, un grado de paralelismo ilimitado y una sobrecarga que conseguimos hacer despreciable ¿Cuál sería la ganancia en velocidad para un número ilimitado de unidades de procesamiento?. 0. 1/0.4. 1. 1/0.20. Se va a ejecutar en paralelo los códigos P1 y P2 en un multiprocesador con consistencia de ordenación débil (suponga que el compilador no altera el código y que inicialmente A=0 y k=1): P1: A=5; A=4+A; k=0; P2: While(K==1){} print A+3; Cual de las siguientes salidas no puede ser correcta al imprimir el resultado. 12. 7. 9. 3. Indique el número de procesadores necesario para que la ganancia de un código con el 25% de código paralelizable sea igual a 1,5 según la Ley de Gustafson. 3. 10. 5. Ninguna de las anteriores. En un enlace largo se cumple (Elimina la incorrecta): Propagación de varios phits simultáneamente. Puede existir solapamiento en la recepción de las unidades de transmisión. El tiempo de propagación tiene que ser mucho mayor que el tiempo de ciclo de red. La latencia es siempre proporcional a la longitud del canal. Indica qué afirmación es la incorrecta. Los multiprocesadores COMA. Permiten la replicación y migración de bloques de memoria. Gestionan la memoria local de los procesadores como caché. Tienen un tiempo de acceso a una dirección determinada que depende de su posición física. No mantienen coherencia porque no es necesaria en este tipo de máquinas ya que sólo tienen caché. Indicar en cual de los siguientes casos sería posible que un paquete enviado no llegara su destino. En una mariposa bidireccional con algoritmo del tipo up-down. En una red estática bidimensional tipo malla con encaminamiento up-down. En una malla con un algoritmo ordenado por dimensión. En una red estática tipo toro con un algoritmo ordenado por dimensión. La función colectiva MPI_Barrier(comm,ierr) sirve para: Establecer una barrera entre todos los procesos de un comunicador. Establecer una barrera entre algunos procesos de un comunicador. Recolecta todos los resultados de una operación anterior en una estructura de datos. Ninguna de las anteriores. Ordena de mayor a menor la siguiente secuencia: Latencia total > Latencia de red observada > Latencia transporte observada. Latencia total >= Latencia de red observada >= Latencia transporte observada. La secuencia a si tenemos una red indirecta y sino la b. Latencia total > Latencia transporte observada > Latencia de red observada. En un algoritmo de encaminamiento multifase se cumple: (elimina la incorrecta). Que puede ser encaminamiento distribuido o encaminamiento en fuente. Que el encaminamiento siempre se produce con un destino intermedio aunque el nodo esté conectado al mismo conmutador. Que se puede equilibrar la carga para mallas y toros. Que los algoritmos de este tipo pueden ser deterministas. En una red no bloqueante podemos afirmar: (elimina la incorrecta). Cualquier fuente puede conectarse a cualquier destino pero puede afectar a las conexiones en curso. La funcionalidad es la misma que en una red de barras cruzadas pero la latencia será mayor. Ofrece más caminos posibles para cada par origen-destino. Uno de los ejemplos más representativos es la red de Clos. Suponga un multiprocesador que implementa MESI sobre una red de medio compartido. Si un procesador escribe en un bloque que en su caché aparece con estado E, las acciones que se deben tomar son: Generar una petición de acceso exclusivo puesto que va a modificar el dato. Generar una petición de acceso y esperar que se la concedan. Pasar el bloque a estado modificado y notificar a los demás que él tiene la última copia válida del bloque. Ninguna de las anteriores. La distancia mínima en una red toro-bidireccional de dim. 3 y base 4 entre el nodo 25 y el nodo 58 es: 4. 1. 3. Ninguna es correcta. En un CC-NUMA con 14 nodos y protocolo de coherencia de 3 estados (Inválido, Modificado y Compartido). Teniendo en cuenta que se usa una implementación de Vector de Bits completa y que cada nodo tiene 4GB de memoria y una línea de cache de 64 bytes ¿Qué tamaño tiene el directorio?. 1 GB. 2 GB. 35 MB. Ninguna de las anteriores. ¿Qué palabra no se corresponde con el resto?. HPF. SMP. COMA. NUMA. MPI_COMM_WORLD básicamente es: Un comunicador que agrupa a todos los procesos ejecutados por MPI que comparten el mismo padre. Es el nombre por el que se agrupan todas las distribuciones de MPI. Un parámetro de las funciones relacionadas con send en MPI. Ninguna de las anteriores. Teniendo una imagen a la que se le quiere aplicar un conjunto de acciones secuenciales y dependientes en un computador paralelo ¿Que estructura paralela considera más apropiada?. Maestro-Esclavo. Segmentada. Divide y vencerás. Descomposición del dominio. ¿Qué llamada a primitiva es correcta?. Compare&Swap(a,b,c) con a=1,b=2,c=3 y salidas a=1, b=3, c=2. Fetch&Add(a,b) con entradas a=0,b=1 y con salidas a=1, b=1 devolviendo la función 1. Test&Set(x) con entradas x=0 y salidas x=1 devolviendo la función un 0. Ninguna de las anteriores. Un programador está usando el siguiente código para barreras en un multiprocesador con un modelo de consistencia en el que lo único que no se garantiza es W->R (bar y k son variables compartidas y el resto son variables locales y la operación Fetch_&_Or(k,1) no garantiza ningún orden en los accesos a memoria. Barrera(id, num_procesos) { band_local= !(band_local) while (Fetch_&_Or(k,1)==1) {}; cont_local = bar[id].cont++; k=0; if(cont_local == num_procesos) { bar[id].cont = 0; bar[id].band = band_local;} else while (bar[id].band != band_local) {}; } ¿Cuál de las siguientes afirmaciones es la correcta?: No funciona bien como barrera. El motivo es que no garantiza acceso exclusivo a alguna(s) variable(s) compartida(s). El código funciona perfectamente como barrera. No funciona bien como barrera porque accesos de lectura posteriores a {k=0} pueden adelantar a esta instrucción. No funciona bien como barrera. El motivo es que permite que accesos a memoria anteriores a {k=0} puedan ejecutarse después de esta instrucción y que accesos a memoria posteriores a {Fetch_&_Or(k,1)} puedan adelantar a esta instrucción. ¿Qué característica no es propia de un multiprocesador con espacio de direcciones compartido?. El programador tiene que saber donde están los datos. La comunicación se produce mediante direcciones de memoria. Soporte hardware para implementar primitivas de sincronización. Ninguna de las anteriores. Una máquina UMA ha sido reestructurada para que albergue la misma cantidad de memoria pero tipo NUMA. En la versión actual podemos observar: Nada en especial, las prestaciones globales seguirán igual porque la cantidad de memoria es la misma. Que las comunicaciones son más rápidas entre cualquier par de nodos. Que las tablas para mantener la coherencia ocupan más que antes. Que la latencia media de los accesos a memoria es menor. Un programa tarda 60 segundos en ejecutarse en un multiprocesador. Durante un 20% de ese tiempo se ha ejecutado en 5 procesadores; durante un 40%, en tres; y durante el 40% restante, en un procesador (consideramos que se ha distribuido la carga de trabajo por igual entre los procesadores que colaboran en la ejecución en cada momento, y despreciamos sobrecarga). ¿Cuál es la ganancia en velocidad? ¿Cuál es la eficiencia?. Ganancia 0.52 y eficiencia 2.6. Ganancia 0.52 y eficiencia 0.6. Ganancia 2.6 y eficiencia 1.52. Ganancia 2.6 y eficiencia 0.52. Indique qué palabra no se corresponde con la serie: Procesadores. Tarjeta. Placa. Chasis. Indique qué palabra no se corresponde con la serie: Instrucción. Proceso. Hebra. Tarea. Indique qué expresión no se corresponde con la serie: Segmentada. Superescalar. Granja de tareas. Divide y vencerás. Si un computador paralelo se compone de 4 servidores de gama alta (cada uno con 64 procesadores que comparten espacio de direcciones físico) conectados entre sí con Gigabit Ethernet, probablemente se trate de: Un NUMA. Un COMA. Un constelación. Un multiprocesador. ¿Cuál de las siguientes afirmaciones es incorrecta?. Un PC con Core 2 Duo es un CC-NUMA. Un PC con Core 2 Duo es un SMP. Un PC con Core 2 Duo es un multiprocesador. Un PC con Core 2 Duo es un UMA. Un 20% de un programa no se puede paralelizar, el resto se puede distribuir por igual entre cualquier número de procesadores. ¿A partir de cuál qué número de procesadores se podrían conseguir ganancias mayores o iguales que 3?. 6. 3. 4. 5. ¿Cuál de las siguientes clases de computadores paralelos es la más escalable?. NCC-NUMA. CC-NUMA. SMP. COMA. Indique qué palabra no se corresponde con la serie: TPC. ScaLAPACK. NPB2. PVM. Si un computador paralelo cuesta 60.000 dólares, se trata de: Un PC. Un computador de gama básica (entry-level). Un computador de gama alta (high-end). Un computador de gama media (mind-range). Indique qué expresión no se corresponde con la serie: Sintéticos. Núcleos (kernels). Microbenchmark. Tiempo de respuesta. Indique qué expresión no se corresponde con la serie: Dado de silicio. Red de interconexión. Módulo multichip. Tarjeta. Indique qué palabra no se corresponde con la serie: HPF (High Perfomance Fortran). Ada. Java. MPI. Indique qué expresión no se corresponde con la serie: alta disponibilidad. RAS. MPMD. escalabilidad. Indique cuál de estas afirmaciones sobre un servidor blade es incorrecta: Tiene mayor disponibilidad que un computador paralelo basado en rack. Ocupará menos espacio que un empaquetamiento rack con el mismo número de servidores. Presenta menos escalabilidad que un computador paralelo basado en rack. Presenta menos serviciabilidad que un computador paralelo basado en rack. Si en un computador paralelo todos los procesadores comparten el espacio de direcciones físico seguro que se trata de un: CC-NUMA. multiprocesador. MPP. multicomputador. Cuál de estas afirmaciones es incorrecta. El paralelismo a nivel de bucle se puede hacer explícito: Dentro de una instrucción para que lo pueda aprovechar una arquitectura ILP. A nivel de hebra para que lo pueda aprovechar un multiprocesador. A nivel de proceso para que lo pueda aprovechar un multicomputador. Al nivel de hebra para que la pueda aprovechar un procesador con multihebra simultánea. Cuál de las siguientes afirmaciones sobre la asignación de tareas a procesos es incorrecta: No se puede usar una asignación estática cuando el número definitivo de tareas a realizar se conoce en tiempo de ejecución. La asignanción dinámica proporciona menor tiempo de ejecución. La asignación dinámica puede permitir que un programa acabe aunque falle algún procesador durante la ejecución. La asignación dinámica se implementa en multicomputadores con una estructura de procesos Master/slave. Indique cuál de las siguientes afirmaciones es correcta. Un cluster difiere de una red de computadores en que: No se usa tecnología LAN como red de interconexión. La red del sistema no está disponible comercialmente. Los nodos no son computadores completos. No circula por la red tráfico externo, sólo el tráfico generado por la aplicaciones que ejecutan los nodos del cluster. Indique qué tarea no se corresponde con la serie: añadir lo necesario para crear y terminar procesos y/o hebras. añadir lo necesario para asignar tareas a procesos y/o hebras. buscar herramienta de programación. localizar paralelismo. Indique qué palabra no se corresponde con la serie: MPI. SPMD. OpenMP. shmem. Para expresar la ley de Amdahl se suele utilizar una expresión como la siguiente: S(p)=p/(f*p+(1-f)). ¿Cuál de las siguientes afirmaciones es incorrecta?: f representa la fracción del tiempo de ejecución paralelo que supone la ejecución del código no paralelizable. S(p) representa la ganancia en prestaciones que se consigue paralelizando el código en p procesadores. p representa la ganancia que se obtendría si se pudiera paralelizar todo el código. Si p tiende a infinito la ganancia tiende a 1/f. Indique cuál de los siguientes programas paralelos presenta mejor escalabilidad: Programa que presenta una isoeficiencia con orden de p*log(p). Programa que presenta una isoeficiencia con orden de p*p*p. Programa que presenta una isoeficiencia con orden de complejidad de p+p*p. Programa que presenta una isoeficiencia con orden de p*p. Para formular la ley de Gustafson (ganancia escalable) se suele utilizar una expresión como la siguiente: S(p)=p(1-f)+f. ¿Cuál de las siguientes afirmaciones es incorrecta?:Para formular la ley de Gustafson (ganancia escalable) se suele utilizar una expresión como la siguiente: S(p)=p(1-f)+f. ¿Cuál de las siguientes afirmaciones es incorrecta?: S(p) representa la ganancia en prestaciones que se consigue paralelizando el código en p procesadores. La ganancia crece conforme se incrementa p con una pendiente constante de 1-f. f representa la fracción del tiempo de ejecución secuencial que supone la ejecución del código no paralelizable. p es el número de procesadores. Se quiere implementar un programa paralelo para un multicomputador que calcule la desviación típica de un conjunto de N datos (x1 a xN). Inicialmente xi se encuentra en el nodo i y N en el 0. Sólo se van a usar funciones de comunicación colectivas. ¿Cuál es el número mínimo de funciones de comunicación colectivas que se deben usar y cuáles serían?. dos: dos reducciones. dos: un recorrido (scan) y una reducción. tres: dos reducciones y una difusión. cuatro: dos reducciones y dos difusiones. Se dispone de una red 4-cubo 8-aria con: (1) canales fullduplex, (2) conmutación vermiforme, (3) conmutadores con buffer asociados a las entradas y a las salidas con el tamaño mínimo posible que permite la técnica de conmutación, (4) algoritmo ordenado por dimensión sin canales virtuales y (5) sin ciclos burbuja. ¿Cuántos paquetes como mínimo pueden estar involucrados en una situación de interbloqueo?. 8. 16. 4. 2. Indique en cuál de los siguientes casos puede ocurrir que haya paquetes que se envían y nunca llegan al destino (en ningún caso se usan canales virtuales o ciclos burbuja): Una mariposa bidireccional con algoritmo up-down. Una red malla con encaminamiento up-down. Una malla con encaminamiento ordenado por dimensión. Un cubo con encaminamiento ordenado por dimensión. Indique cuál de las siguientes tareas no es propia o frecuente en los conmutadores: Arbitrar entre paquetes que se quieren dirigir a la misma salida. Almacenar la información en tránsito por la red. Garantizar unas mínimas prestaciones en la red. Determinar, para cada paquete que llega, por cuál qué canal de salida ha de encaminarse. Indique que expresión no se corresponde con la serie: red mariposa. red de benes. árbol grueso. hipercubo. Qué tamaño tiene un buffer en un conmutador de un sistema de comunicación si: (1) utiliza conmutación vermiforme, (2) los buffers tienen capacidad para albergar el doble del mínimo que permite la técnica de comuntación, (3) tiene phits de 8 bits y (4) tiene unidades de control de flujo de conmutación con tamaño igual al doble de las unidades de control de flujo físico. 64. 32. 16. 8. Indique cuáles de estas afirmaciones es incorrecta: Los canales virtuales se utilizan para mejorar el ancho de banda en redes con conmutación vermiforme. Los canales virtuales se utilizan para evitar interbloqueos en los que intervienen paquetes de distinto tipo. Los canales virtuales se utilizan para evitar interbloqueos en el nivel de encaminamiento del sistema de comunicación. Los canales virtuales se utilizan para evitar interbloqueos en el nivel de conmutación del sistema de comunicación. Los algoritmos con escape son o pueden ser: parcialmente adaptativos. completamente adaptativos. multifase. determinísticos. Se dispone de una 3-malla 8-aria full-duplex. Teniendo en cuenta que tiene enlaces de 100 MB/s, qué ancho de banda global (asintótico) ofrece para tráfico uniforme: 12800 MB/s. 25600 MB/s. 100 MB/s. 6400 MB/s. El algoritmo up-down para una red ortogonal es o puede ser: parcialmente adaptativo. completamente adaptativo. determinístico. multifase. Cuántos caminos mínimos se pueden utilizar para la transferencia de paquetes entre el nodo (4,6) y el nodo (6,5) en una 2-malla 8-aria con algoritmo up-down: 3. 2. 1. 4. El algoritmo ordenado por dimensión es: determinístico. multifase. adaptativo. inconsciente. Se dispone de una red 4-cubo 8-aria con: (1) canales fullduplex, (2) conmutación virtual cut-through, (3) conmutadores con buffer asociados a las entradas con el doble del tamaño mínimo posible que permite la técnica de conmutación. Teniendo en cuenta que implementa un algoritmo ordenado por dimensión sin canales virtuales, ¿cuántos paquetes pueden estar involucrados en una situación de interbloqueo?. 16. 2. 4. 8. El diámetro en una red s-cubo 2^t-aria con canales unidireccionales es (NOTA: 2^t denota 2 elevado a t): s*[2^(t-1)]. s*[(2^t)-1]. (2^t)*(s-1). (2^t)*s/2. Para implementar una red multietapa bloqueante de tamaño mínimo que conecte 32 entradas con 32 salidas se necesitan: 32 conmutadores. 16 conmutadores. 64 conmutadores. 80 conmutadores. Indique cuál de estas afirmaciones es incorrecta: Los interbloqueos se pueden evitar en el nivel de encaminamiento de la red. La topología influye en que pueda haber o no interbloqueos en una red. Un interbloqueo es la situación que se presenta cuando un paquete no puede avanzar porque necesita utilizar un recurso que otro paquete está utilizando. Los interbloqueos se pueden evitar en el nivel de conmutación de la red. La distancia mínima entre los conmutadores de posición en decimal 100 y 301 en un multicomputador con 400 nodos conectados mediante una red cubo de dos dimensiones y con enlaces bidireccionales es: 12. 20. 11. 19. Indique qué expresión no se corresponde con la serie: Optimista. Retroceso. Handshake o Protocolo simple. ON/OFF. Se tiene una red con conmutación "virtual cut-through", buffer con capacidad para 256 bits y enlaces estrechos con 32 líneas de cobre. En esta red un paquete podría ser, por ejemplo, de: 8 bits. 16 bits. 300 bits. 128 bits. Indique cuál de las siguientes afirmaciones es incorrecta: Un enlace es largo si se pueden propagar varios phits simultáneamente. Si un enlace estrecho tiene n líneas para transferir bits entonces el phit tiene tamaño n. Un enlace es ancho si se puede transferir en paralelo bits del paquete y bits de control. Un enlace es estrecho si se puede compartir por varios paquetes multiplexando en el tiempo su uso. Si una red que conecta 16 nodos tiene 64 enlaces en total, entonces se puede tratar de: Una 2-malla 4-aria con canales full-duplex. Una red mariposa unidireccional con conmutadores de 4x4. Una mariposa bidireccional con conmutadores 2x2 y con canales full-duplex. Un 2-cubo 4-ario con canales full-duplex. Si una red que interconecta entre sí 4 elevado a s nodos tiene un ancho de bisección de 4 elevado a s, entonces se trata de: un s-cubo 4-ario con canales bidireccionales full-duplex. una red multietapa bloqueante unidireccional. una s-malla 4-aria con canales half-duplex. una red multietapa bloqueante bidireccional con canales halfduplex. Indique cuál de estas afirmaciones es incorrecta: El control de flujo en el nivel de conmutación puede garantizar que hay en el destino espacio para la unidad de transferencia. El control de flujo en el nivel de conmutación puede garantizar un envío sin errores de la unidad de transferencia. El control de flujo en el nivel de conmutación debe arbitrar entre unidades que quieren utilizar el mismo recurso a la vez. El control de flujo en el nivel de conmutación controla la transferencia de flits entre conmutadores. Indique cuál de las siguientes afirmaciones es incorrecta: En una red cubo con encaminamiento up-down los interbloqueos se pueden evitar con ciclos burbuja. En una red multietapa mariposa bidireccional con encaminamiento up-down no se pueden producir interbloqueos. En una red malla con encaminamiento up-down los interbloqueos se pueden evitar con ciclos burbuja. En una red cubo con encaminamiento up-down los interbloqueos se pueden evitar estableciendo un orden en la utilización de canales virtuales. Cuántos caminos mínimos se pueden utilizar para la transferencia de paquetes entre el nodo (4,6) y el nodo (6,5) en una 2-malla 8-aria con algoritmo completamente adaptativo mínimo progresivo con escape a ordenado por dimensión: 3. 4. 2. 1. Cuántos caminos mínimos se pueden utilizar para la transferencia de paquetes entre el nodo 4 y el nodo 7 en una red mariposa bidireccional que conecta 8 nodos: 1. 2. 3. 4. Indique cuál es la afirmación incorrecta. El algoritmo intervalo es: distribuido. inconsciente. basado en tablas. ordenado por dimensión. Indique qué palabra no se corresponde con la serie: Adaptativo. Distribuido. Centralizado. Fuente. Se va a ejecutar en paralelo los códigos P1 y P2 en un multiprocesador con consistencia de ordenación débil (suponga que el compilador no altera el código y que inicialmente A=0 y k=1): P1 P2 A=5; while (k==1) {}; A=3+A print A+3; k=0; Indique cuál de los siguientes afirmaciones es incorrecta: como resultado se puede imprimir 11. como resultado se puede imprimir 8. como resultado se puede imprimir 6. como resultado se puede imprimir 3. Se tiene un multiprocesador en el que al ejecutar en paralelo los códigos P1, P2 y P3 se puede obtener como resultado 4,0 o 4,1 (considere que el compilador no altera el código y que k1=k2=A=0). ¿Qué modelo de consistencia tiene el multiprocesador? P1 P2 P3 A=1; while (k1==0){}; while (k2==0){}; k1=1; B=A+3; print B,A; k2=1;. Modelo de consistencia de liberación. Modelo de consistencia que sólo relaja W->R. Modelo de consistencia que no garantiza W->R ni atomicidad. Modelo de consistencia secuencial. Indique cuál de las siguientes afirmaciones es incorrecta: Si se usa actualización, cuando se escribe en la copia de un bloque en una cache, se actualizan las copias del bloque en otras caches. Si se usa postescritura, no hay que actualizar memoria cada vez que se escribe en cache. Si se usa invalidación, cuando se va a escribir en la copia de un bloque en una cache, se invalidan las copias del bloque en otras caches y en memoria. Si se usa escritura inmediata, cuando se escribe en una cache, se actualiza memoria principal. Se ha ejecutado el siguiente código en un multiprocesador con un modelo de consistencia en el que lo único que no se garantiza es W->R: for (i=ithread ; i<4 ; i=i+nthread) { sump = sump + a[i]; } while (Fetch_&_Or(k,1)==1) {}; sum = sum + sump; k=0; Indique qué se obtiene en sum si se suma la lista a={1,2,3,4}, k y sum son inicialmente 0, el compilador no puede cambiar k=0 de sitio y nthread=2: 10. 3. 7. 3, 7 o 10. En un CC-NUMA con red de interconexión 3-malla 8-aria y algoritmo up-down mínimo, indique el número de caminos que existen en este sistema entre el nodo (1,2,3) y el (2,3,2). 1. 4. 3. 2. Cuál de los siguientes modelos de consistencia permite mejores tiempos de ejecución: modelo de consistencia secuencial. modelo de ordenación débil. modelo implementado en el Itanium. modelo implementado en los procesadores de la línea x86 de Intel. Suponga un multiprocesador basado en un bus con protocolo MESI, si llega a una cache un paquete de petición de lectura exclusiva que se refiere a un bloque que tiene en estado exclusivo, el controlador lleva a cabo las siguientes acciones: Pasa el bloque a estado inválido. Genera un paquete de respuesta con el bloque y pasa el bloque a estado exclusivo. Pasa el bloque a estado exclusivo. Genera un paquete de respuesta con el bloque y pasa el bloque a estado inválido. Suponga un multiprocesador con el protocolo MESI, si a un nodo le llega una petición de lectura exclusiva de un bloque que tiene en estado modificado debe: Pasar el bloque a estado inválido. Generar paquete de respuesta con el bloque y pasar el bloque a inválido. Generar paquete de respuesta con el bloque y dejar el bloque en exclusivo. Pasar el bloque a exclusivo. La ley de Amdahl... Nos dice que para un tiempo secuencial (Ts) constante, en que se realiza una carga Q, es posible paralelizar esa carga tanto como queramos para reducir el tiempo de ejecución. Nos dice que para un tiempo paralelo (Tp) constante, en que se realiza una carga Q, entonces, en el mismo tiempo Tp, siempre se puede resolver un problema de carga cte*Q. Nos dice que para un tiempo secuencial (Ts) constante, en que se realiza una carga Q, el límite superior de paralelización depende de la fracción del código no paralelizable. Ninguna de las anteriores. La función de Isoeficiencia pone de manifiesto como debe crecer un problema de tamaño n conforme aumenta el número de recursos con los que se cuenta para resolverlo, p. Para la extracción de la función se hacen una serie de suposiciones: Que el tiempo de ejecución de la parte secuencial del código es despreciable. Que la sobrecarga de tiempo debido a la mala gestión de la carga entre el conjunto de recursos disponibles disponibles p, es despreciable. Que la sobrecarga por la penalización por la mala gestión de la carga de trabajo Q entre el número de recursos disponibles, p se incluye en la función T0(p,n). Las tres opciones anteriores se complementan y son todas verdaderas. Un tipo de empaquetamiento en blade se diferencia de uno en rack en: El tipo de empaquetamiento en blade necesita más cableado que uno en rack. El empaquetamiento en rack permite de tarjetas de expansión y el de blade no. El tipo de empaquetamiento en blade necesita menos cableado que uno en rack. No se diferencian en nada. En un multiprocesador: Los procesadores comparten sólo los módulos de memoria. Cada procesador tiene su unidad de E/S y no permiten el acceso de esta unidad a los demás módulos de memoria de los demás procesadores. Cada procesador tiene su propio espacio de direcciones en la memoria. Los procesadores comparten los módulos de memoria y otras unidades como las unidades de E/S. Los procesadores MPP son: Computadores paralelos con un número de procesadores superior a 1000. Se utilizan sólo en multicomputadores. Computadores paralelos fuertemente acoplados y todos sus procesadores se ven como una única unidad. Todas las respuestas anteriores son ciertas. La función MPI_SCATTER implementa: Un mecanismo de difusión de mensajes. Un mecanismo de reducción de mensajes. Un mecanismo de dispersión de mensajes. Ninguna de las anteriores es correcta. La ganancia en prestaciones se expresa como: El tiempo de la versión mejorada entre el tiempo de la versión mejorada. La velocidad de la versión sin mejorar entre la velocidad de la versión mejorada. La velocidad de la versión mejorada entre la velocidad de la versión sin mejorar. Ninguna de las anteriores. Una operación de reducción consiste en: "Barajar" el envío de distintos datos, entre diferentes destinos. Comunicar todos los procesos con uno en concreto que hará de recolector de datos para realizar una operación sobre ellos. Envíar un mismo dato a todos los destinos. Ninguna de las anteriores. ¿Cualquier proceso siempre se ejecutará más rápido en un multicomputador o multiprocesador que en un monoprocesador?. Si, porque un multicomputador o multiprocesador tiene muchos más recursos para poder ejecutar el proceso. No, si el código es secuencial y no paralelizable la comunicación necesaria en un multicomputador o multiprocesador penaliza la ejecución. Si, porque el sistema paralelo siempre encontrará la forma de ejecutar partes en paralelo y, por tanto, de forma más rápida. No, si el código es no paralelizable se ejecutará en un solo procesador aunque se disponga de varios, dependerá de las prestaciones del procesador escogido para la ejecución en el multiprocesador o multicomputador en comparación con las prestaciones del monoprocesador. Indica que afirmaciones son ciertas acerca de las funciones de encaminamiento y las técnicas de conmutación: Ambas operaciones trabajan sobre phits recibidos por un controlador de enlace. El encaminamiento define en un conmutador, qué salida debe tomar un paquete y la conmutación define cómo un flit atraviesa el camino hacia el destino. La conmutación depende del encaminamiento. Todas las anteriores. La técnica de conmutación Vermiforme : Tiene una latencia de transporte menor que Almacenamiento y Reenvío cuando se tiene en cuenta sólo un flit de cabecera. Tiene la misma latencia de transporte que Virtual Cut-Through, independientemente del número de flits. Tiene una latencia de transporte mayor que Almacenamiento y Reenvío cuando se tiene en cuenta sólo un flit de cabecera. Ninguna de las anteriores. El tiempo dedicado a encaminamiento incluye: El tiempo desde que se introduce el primer bit de la cabecera en el sistema de conmunicación hasta que se recibe el último bit de la cabecera en el destino. El tiempo desde que se introduce el último bit de la cabecera en el en el sistema de conmunicación hasta que se recibe el primer bit de la cabecera en el destino. El tiempo desde que se introduce el primer bit de la cabecera en el búffer de entrada del origen hasta que se recibe el último bit de la cabecera en el destino. Ninguna de las anteriores. La Latencia de transporte es: El tiempo desde que se inyecta en la red el último bit en el origen hasta que se recibe el primer bit en el destino. El tiempo desde que se inyecta en la red el último bit en el origen hasta que se recibe el último bit en el destino. El tiempo desde que se inyecta en la red el primer bit en el origen hasta que se recibe el último bit en el destino. El tiempo desde que se inyecta en la red el primer bit en el origen hasta que se recibe el primer bit en el destino. En la técnica de conmutación de “conmutación de circuitos”: Todos los fits pasan de un conmutador al siguiente del camino entre origen y destino antes de continuar con la función de encaminamiento. Tan pronto como un flit alcanza el siguiente conmutador del camino entre origen y destino, puede ser encaminado sin importar que los demás hayan llegado. Tan pronto como un flit alcanza el siguiente conmutador del camino entre origen y destino, puede ser encaminado sin importar que los demás hayan llegado. Sin embargo, si la cabecera queda bloqueada en algún conmutador el resto de flits se acumularán en los buffers más próximos y libres hasta que se pueda continuar el trasporte. Ninguna de las anteriores es correcta. La función del control de flujo son: Garantizar que la unidad de información que se transporta se almacena en el destino. Asegurar una recepción sin errores de la unidad de información que se transporta. Resolver a qué buffer del canal virtual se debe enviar un flit. Ninguna de las anteriores. El grado de una red tipo mariposa de KnxKn, siendo N el número de entradas y el número de salidas y n la base de los comutadores se calcula con la expresión: 2^k+2^k. k^n. 2·k. ninguna de las anteriores. En las experesiones de la latencia de transporte para todas las técnicas de conmutación, se incluye un factor que relaciona el tiempo de transporte con la longitud del camino que separa el origen y el destino del paquete que se transporta. Este factor lo representamos por D y representa: La distancia mínima entre origen y destino del paquete menos uno. El número de conmutadores que separan origen y destino más uno. El número de pares de conmutadores que separan origen y destino más uno. Ninguno de los anteriores. El uso de canales virtuales: Repercute directamente en el coste de la red. No repercute en el ancho de banda global de la red. No afecta a la funcionalidad del controlador de enlace. Hace que la red sea menos productiva porque se enviarán menos paquetes. Un sistema de recolección de datos atmosféricos situado en el polo norte que recoge datos de humedad, temperatura y presión cada 12 horas. Estos datos se almacenan y se envían a otro servidor en Granada en periodos de tiempo no regulares marcados por la estabilidad atmosférica. Teniendo en cuenta estas características, este sistema obligatoriamente debería ser: Tolerante a fallos. Eficiente. Funcional. Escalable. La capacidad del canal o ancho de banda disponible: Se puede medir con un bechmark como el Ping-Pong. Es el tiempo de latencia total de un mensaje de un tamaño m. Es la capacidad de trasmisión de los canales de la red. Es el tiempo necesario para enviar un mensaje de tamaño pequeño. El encaminamiento multifase: Se realiza siempre en la fuente del paquete. Es determinista. Se implementa con tablas de consulta. Ninguna de las anteriores. El algoritmo de encaminamiento UP-DOWN las principales características son: Se trata de un algoritmo determinista. Está diseñado para redes estrictamente ortogonales. Se aplica en situaciones en las que el algoritmo ordenado por dimensión no se puede aplicar. Ninguna de las anteriores. En sistemas donde la actualización de la memoria principal se realiza siguiendo una política write-thought: No hace falta mantener la coherencia de caché porque la memoria principal siempre está actualizada. No es necesario mantener la coherencia sobre estructuras de datos de solo lectura. Se mantiene la coherencia pero sólo para los datos locales de cada procesador. Se mantiene la coherencia con un protocolo basado en directorios. En el protocolo de coherencia basado en directorios, el estado de un bloque puede tener el estado local que representa: Un bloque que está siendo utilizado por el nodo propietario de ese bloque. Un bloque que lo pueden haber leido varios nodos del multicomputador, pero ninguno se ha modificado. Un bloque que no está siendo utilizado por ningún nodo. Ninguna de las anteriores. Un programa tarda 100 seg en ejecutarse en un multiprocesador. Durante un 20% de ese tiempo se ha ejecutado en cuatro procesadores; durante un 50% en tres; y durante el 30% restante en un procesador (considerando una distribución equilibrada de la carga, que colaboran en cada momento en su ejecución y que se despreciará la sobrecarga) ¿Cuánto tiempo tardaría el programa en un sólo procesador y cual es su eficiencia?. 130 s. 0.775 de eficiencia. 124 s. Eficiencia de 0.65. 124 s. eficiencia de 0.775. 260 s, eficiencia de 0.65. En una red baraje de 8 entradas y 27 salidas la función que define el baraje de los enlaces es: Bac(f) = (a*f) mod(c-1), si f<c-1 y c-1 si f=c-1. Siguiendo esta regla, la salida 2 de la etapa 0 y la salida 5 de la etapa 1 se conectan a: la salida 2 de la etapa 0 a la entrada 0 del conmutador 2 y la salida 5 de la etapa 1 a la entrada 0 del conmutador 5 de la etapa 2. No se puede construir esa red baraje. La salida 2 de la etapa 0 a la entrada 3 del conmutador 0 y la salida 5 de la etapa 1 a la entrada 2 del conmutador 6 de la etapa 2. La salida 2 de la etapa 0 a la entrada 1 del conmutador 3 y la salida 5 de la etapa 1 a la entrada 2 del conmutador 6 de la etapa 2. En el modelo de consistencia de liberación hay dos tipos de operaciones de sincronización, adquisición y liberación y mantiene los siguientes órdenes de accesos: Mantiene el orden entre un punto de liberación y cualquier operación de acceso a memoria posterior y mantiene el orden entre cualquier operación de acceso a memoria y una operación de adquisición posterior. Mantiene el orden entre un punto de adquisición y cualquier operación de acceso a memoria posterior y mantiene el orden entre cualquier operación de acceso a memoria y una operación de liberación posterior. Permite adelantar las escrituras a las lecturas y las escrituras a las escrituras. Los tipos de punto de sincronización son solamente uno y no se permiten el adelantamento de las operaciones de acceso a memoria que se salten un punto de sincronización. En una operación Compare&Swap(a,b,x) se devuelve: El valor de la variable a antes de intercambiarse con b. El valor de la variable b antes de intercambiarse con a. El valor de la variable x, si a es igual a x. No devuelve ningun valor. El tamaño de un directorio de vector de bits completo para un nodo que tiene 2Gbytes de memoria principal y se incluye dentro de un sistema de 254 nodos donde el tamaño del marco de página es de 128 bytes es de: 2 Gb. 1Gb. 512 Mb. Ninguna de las anteriores. |