Cuestionario @Data Developer
![]() |
![]() |
![]() |
Título del Test:![]() Cuestionario @Data Developer Descripción: EXAMEN DATIO DEVELOPER |




Comentarios |
---|
NO HAY REGISTROS |
Scaffolder ¿Cuál es el comando para validar el código?. kaa -lint. mvn -test. kaa lint. mvn test. Scaffolder: ¿Cuál es el archivo donde se almacenan las librerías?. requirements.tx. pom.xml?. sonar?. jenkinsfile?. Scaffolder ¿Cuál es el comando para empaquetar el código?. kaa limt. kaa package. kaa -limt. mvn -package. Scaffolder Entry point de Scaffolder. Notebook. Python. scala. sql. Scaffolder ¿Cuál es el comando para realizar los test unitarios?. kaa test. kaa -test. mvn test. Scaffolder ¿Cuál es el archivo que declara las librerias que necesitamos en Scaffolder?. requirements.txt. pom.xml. sonar-project-properties. jenkinsfile?. Scaffolder ¿Cuál es el comando para validar la sintaxis en Scaffolder?. kaa -lint. kaa -package. mvn -test. kaa lint. mvn test. Arquitectura Qué información contiene la herramienta Taxonomy?. solo catálogos locales. solo catálogos globales. parametrías. catálogo global, local y holding. catalogos locales y globales. Arquitectura ¿Cuál es parte del relevamiento funcional? Señale qué acciones realiza Spark Context. obtener una descripción funcional de la fuente. obtener el nombre de los campos. perfilamiento de los datos. Todas las anteriores. Arquitectura ¿Qué debe contener el ticket jira para que Core Assurance valide un dictamen?. BUI del proyecto, dictamen, excel con campos. BUI del proyecto, dictamen, excel sin campos. Arquitectura ¿Qué es el dictamen? (Verdadero o Falso) Es un documento que termina en una resolución para determinar si el input es nuevo o si se va a reutilizar un input. Verdadero. falso. Arquitectura ¿Qué es un campo multifuncional? (no se tiene claridad de cuál sería la respuesta, se debe repasar el concepto). campo puede ser un glosario o un campo que puede contener otros campos , normalmente en los dictámenes se mapean en sección campos adicionales. Un campo multifuncional tiene múltiples definiciones funcionales. Múltiples datos funcionales para el mismo campo. Verdadero si corresponde en una multi table (por validar, se requiere mayor especificación.). Campo que tiene muchostipos de valores en un mismo spark s obre hadoop. campo tiene muchos conceptos metidos o el campo tiene un valor para unos registros y otro valor para otras filas. Arquitectura En el nuevo flujo, el diccionario es parte de la etapa de análisis es ¿verdadero o falso?. falso. true. Spark ¿Cuántas tareas se pueden realizar en una partición?. solo 1. cualquier número de tareas. ninguna opción es correcta. Más de uno, menos de 5. Spark ¿Qué opción consume muchos recursos, que particiona nuevamente y en una cantidad determinada previamente?. Repartition. Repeticion. Spark ¿Los RDD son serializables en java? (Verdadero o Falso). Verdadero. falso. Spark ¿Qué afirmación sobre map es correcta?. Map transforma un RDD de longitud N en otro RDD de longitud N. En la operación Map el desarrollador puede definir su propia lógica de negocio personalizada. Se aplica a cada elemento del RDD y devuelve el resultado como nuevo RDD. Spark ¿Qué afirmación sobre map NO es correcta?. Map transforma un RDD de longitud N en otro RDD de longitud N. Se aplica a cada elemento del RDD y devuelve el resultado como nuevo RDD. Spark ¿Cuáles son las transformaciones?. map y filter. map. filter. Spark ¿Cuál no es una acción en Spark?. map. filter. Spark ¿Cuál es la diferencia entre Repartition y Coalesce?. coalesce se usa generalmente para reducir particiones y no genera reorganización. Repartition se usa generalmente para aumentar las particiones, pero producirá cambios aleatorios. map. filter. Spark Repartition y Coalesce, seleccionar respuesta correcta: Con repartition los tamaños de las particiones pueden variar. Coalesce puede aumentar y reducir particiones. Coalesce tiene mejor rendimiento que Repartition. Spark Por defecto, ¿Que método de persistencia se usa Spark?. MEMORY_ONLY. otro. Spark Se quiere leer sólo 2 particiones de la fuente t_pmol_personal_accounts_mov, las correspondientes a 2020-12-31 y 2020-11-30 ¿Cual es la mejor opción?. ruta = "/data/master/pmol/data/t_pmol_personal_accounts_mov" rango = [ruta+"/cutoff_date=2020-12-31", ruta+"/cutoff_date=2020-11-30"] spark.read.parquet(*rango). ruta = "/data/master/pmol/data/t_pmol_personal_accounts_mov" rango = [ruta+"/cutoff_date=2020-12-31", ruta+"/cutoff_date=2020-11-30"] spark.read.option("basePath", ruta).parquet(*rango). ruta = "/data/master/pmol/data/t_pmol_personal_accounts_mov" spark.read.parquet(ruta).filter(col(cutoff_date).isin("2020-12-31","2020-11-30")). ruta = "/data/master/pmol/data/t_pmol_personal_accounts_mov" spark.read.parquet(ruta).filter("cutoff_date in (2020-12-31,2020-11-30)"). Kirby Si se tiene aplyConversion en False, ¿El parámetro castMode= notPermissive ya no es necesario? (verdadero o falso). Verdadero. falso. Kirby Al destokenizar un dato, ¿Qué opción tiene por defecto?. FAIL_FAST. FAIL_TEST. Kirby ¿Dónde se aplica el tokenizado?. conf del raw. conf del master. esquema del raw. esquema del master. Kirby ¿Que realiza el atributo mode=PERMISSIVE?. Ignora todos los registros corruptos. Detiene el proceso si algún registro no cumple con el esquema input. Establece el campo como null, cuando el registro está corrupto. Kirby Son transformaciones Kirby que se aplican a nivel columna: RenameColumn. Partition. DateFormatter. RegexColumn. Kirby Los esquemas son desplegados a la ruta: argos. artifactory. Bitbucket. Sandbox. Kirby ¿En Kirby existe alguna transformación que convierte una columna en nulo? (En kirby existen transformaciones que permiten convertir valores a Null.). Falso. Verdadero. DataX ¿Se puede ejecutar una transferencia sin ser aprobada? (No especifica si es de DataX, ni ambiente). Si fuera DataX la respuesta sería SÍ, siempre y cuando sea en WORK. no se puede. DataX ¿El transfer necesita por lo menos un data Object? Elegir una opción. true. falso (necesita 2). DataX ¿Cuáles son los 3 elementos fundamentales de un data object?. Driver, Metadata,. Mapping, Adapter, Metadata. N.A. Metadata, Schema, Adapter. Schema, Adapter, Mapping. DataX ¿Un transfer se puede ejecutar en estado Draft?. falso. verdadero. DataX ¿La herramienta de DataX permite la transferencia de data por lote?. verdadero. falso. DataX ¿Cuál es el objeto donde se guardan las credenciales de conexión? (No especifica si es de DataX). ADAPTER. TRANSFER. TODAS. NA. DataX ¿Dónde se encapsulan las credenciales para acceder al dataset? → Pregunta ambigua. ADAPTER. DRIVER JDBC. DataX ¿Cuál de las siguientes afirmaciones no es correcta?. Un namespace puede tener múltiples adaptadores usando la misma conexión. Una transferencia debe tener al menos un objeto de datos en su configuración. Una transferencia puede ser ejecutada en estado “Draft”. N.A. DataX ¿Es posible realizar una transferencia sin haber sido previamente aprobada?. Verdadero. Falso. DataX ¿Cuál es el objeto que nos permite encapsular las credenciales de una conexión para acceder a los datos (No especifica si es de DataX). ADAPTER. SCHEMA. MAPPING. DRIVER. NA. Git ¿Cuál es el orden correcto para poder validar y subir un cambio a un repositorio de Git?. git status, git add, git commit , git push. git add, git commit , git push. Hammurabi La regla 1.2, fecha de datos del fichero ¿Como deberían ser los parámetros?. isCritical (true) y withRefusals (false). isCritical (false) y withRefusals (true). Hammurabi La regla 1.2, fecha de datos del fichero ¿Los parámetros: isCritical (Falso) y withRefusals (Falso) esto es falso o verdadero?. falso. verdadero. Hammurabi ¿Qué regla permite validar el mismo dato en diferentes tablas o repositorios en los que está disponible?. Regla 3.3. Regla 5.2 REVISAR. Hammurabi La regla 2.1 del fichero no vacío se aplica en: staging-out/staging, master-procesamiento, staging-in/staging. (staging, master, staging) -(ingesta, procesamiento, ingesta out staging). na. Hammurabi En la regla de validación 1.2 Fecha de datos de fichero, el parámetro critical deberá tener el valor “false” y el parámetro “withRefusals” deberá ser “false”. FALSO. VERDADERO. Hammurabi En la regla de validación 1.2 Fecha de datos de fichero, el parámetro critical deberá tener el valor “true” y el parámetro “withRefusals” deberá ser “false”: FALSO. VERDADERO. Hammurabi ¿Es necesario finalizar la identificación de reglas de calidad para aprobar un dictamen?. VERDADERO. FALSO. Hammurabi Todas las reglas MVP deben aplicarse sin filtros “subset” y con un umbral mínimo del 90%. VERDADERO. FALSO. Otras Preguntas: ¿Cual es una regla mvp de ingesta que se aplica en la capa master?. 2.1. 2.2 relevamiento. 2.3. Otras Preguntas: ¿En que proyecto se usa _LCL y tablas auxiliares?. cdd. cib. alpha. client 360. Control M Opción que permite visualizar el Log del Job de control m con el detalle de las acciones que ha realizado el job: output. Outline. Argos. Ninguna opción es correcta. Log. Control M ¿Cómo evitar que otra persona tome la malla? (no te especifica si es control M). Check out. Check in. blocked. ninguna opción es correcta. Control M ¿Qué opción te permite realizar acciones al finalizar un job, cualquiera sea el status?. Do-actions. actions. Control M Para poder ver el log de la ejecución de un job desde control m de manera detallada se puede realizar desde la opción: output. Outline. Argos. Ninguna opción es correcta. Log. Control M El apartado desde donde se importa, crea, modifica y exporta los XMLS es: planing. xls. Control M El nombre de un folder está compuesto por AA-PPCCCBBB-DDD, donde CCC hace referencia a : Unidad Aplicativa (UUAA) - BR-PECEGMEN-T02. Clave Aplicativa. NA. Periodicidad. Control M El nombre de un folder está compuesto por YY-PPAAACCC-XXX, donde CCC hace referencia a : Unidad Aplicativa (UUAA) - BR-PECEGMEN-T02. Clave Aplicativa. NA. Periodicidad. Control M El nombre de un folder está compuesto por AA-PPCCCBBB-DDD , donde CCC hace referencia a : Clave Aplicativa. NA. Launchpad En el archivo de configuración de la ingesta en Raw, la propiedad charset = “windows-1252” aplica para ficheros: Host. Launchpad (Si es una sola opción es Launchpad). Datio. Localito. Spark Seleccione la definición correcta sobre Spark SQL. Es un módulo de Apache Spark para el procesamiento de datos hadoop estructurados. aplicacion. Spark cual es un beneficio de spark sobre hadoop. Es mucho más rápido en memoria. no lo es. Spark El nivel de almacenamiento predeterminado de cache() es. MEMORY_ONLY. MEMORY. Spark ¿Que herramienta se usa para ver los log?. Argos. Ergos. Spark Diferencia entre Apache spark y MapReduce. Apache Spark corre en memoria y es hasta 100 veces más rápido que MapReduce que corre en disco. no hay diferencias. Spark ¿Cuáles son acciones?. Map(). Reduce() & Take(). Filter(). Commit(). Spark Respecto a Spark Streaming, los datos pueden provenir de las fuentes: Flume. Kinesis. Kafka. Todas las opciones son correctas. Spark Identificar la acción correcta: filter. reduce. todas las anteriores. Map. Spark El API data set es accesible: Scala y Python. Java Scala y Python. Scala y Java. Scala y R. Spark Relación entre Apache Spark y Map Reduce: Igual que map reduce. NA. no hay diferencia. alternativa a map reduce. Spark ¿Cuál es la estructura fundamental de Spark?. DataFrame. Dataset y. RDD. Spark Orquestador de una transferencia en Live (organizador para la ejecución de una transformación en Live). Control M. Cronos. NA. Cron. Spark La transformación de tipo de datos entre Pandas y Spark ¿es eficiente?. Verdadero. Falso. TODAS. NA. Spark ¿Qué es MLIB?. MLlib is Apache Spark's scalable machine learning library. NA. Ninguna. Todas. Spark ¿Cuál de los siguientes es cierto para Spark SQL?. Permite a los usuarios ejecutar consultas SQL/HQL sobre Spark. Proporciona una plataforma de ejecución para todas las aplicaciones Spark. Spark Selecciona la respuesta correcta con respecto a Repartition y Coalesce. Repartition mezcla todas las particiones y crea nuevas siendo una operación costosa. Coalesce puede aumentar y reducir particiones. Con Repartition los tamaños de las particiones pueden variar en gran medida. Coalesce implica repartir los datos usando suffle. Coalesce tiene mejor rendimiento que Repartition. Repartition consume menos recursos. Spark Permite aplicar acciones a los jobs de acuerdo al número de ejecución, status, código con que haya finalizado el Job: Job not finished by time. N.A. Job set to run. Notifications After Jobs Completed. On-Do Actions. Spark Selecciona la respuesta correcta con respecto a Repartition y Coalesce. Repartition mezcla todas las particiones y crea nuevas siendo una operación costosa. Coalesce puede aumentar y reducir particiones. Con Repartition los tamaños de las particiones pueden variar en gran medida. Coalesce implica repartir los datos usando suffle. Coalesce tiene mejor rendimiento que Repartition. Spark Es lo mismo decir “Deuda dictamen” que decir “Deuda técnica”. Verdadero. Falso. Spark Seleccione el enunciado correcto acerca de Spark Context. Interactúa con el Cluster Manager. Ninguna. Especifica cómo acceder al cluster. Ambas. Spark Como se define a un nodo worker. Un nodo que actúa como master y tambien como esclavo. Un nodo que actúa como esclavo para ejecutar tareas. Un nodo master. Spark El dataframe de pandas distribuye su procesamiento en múltiples nodos. Falso. Verdadero. Spark ¿Qué fuentes de datos utiliza Spark?. S3. Máquina Local. Hdfs. Todas las anteriores. Spark ¿Cuáles son los beneficios de Spark sobre MapReduce. A diferencia de Hadoop, Spark proporciona bibliotecas incorporadas para realizar múltiples tareas desde el mismo core, como el procesamiento batch, streaming, machine learning y las consultas SQL interactivas. Sin embargo, Hadoop solo admite el procesamiento batch. Hadoop depende en gran medida del disco, mientras que Spark promueve el almacenamiento de datos en memoria y en caché. Debido a la disponibilidad del procesamiento en memoria, Spark implementa el procesamiento alrededor de 10,000 veces más rápido que Hadoop mapReduce. Todas las anteriores. Spark Multiple opción: Escoja las alternativas CORRECTAS. a y b son correctas. a. Repartition es una opción que mezcla todas las particiones y crea nuevas. b. Repartition es una operación costosa. Solo a es correct. Funcionales ¿Que equipo aprueba los TDS?. DM. DS. Funcionales Método por el cual los equipos de proyectos solicitan certificaciones de TDS a DM. Jira. Scalpy. Ninguna de las anteriores. Sophia. Funcionales ¿Los campos PAN pueden tener menos de 16 caracteres?. No, porque tienen que ser de 16 a 18 de longitud, de lo contrario no funciona el tokenizado. SI. Funcionales ¿Los campos PAN pueden tener como mínimo de 16 caracteres?. Verdadero. Falso. Funcionales Quienes podrán explotar la información de los modelos globales. Solo proyectos de holding. Solo proyectos Locales. Todos los usuarios de DATIO. NA. Funcionales ¿Qué tipos de fuentes son aceptadas como TDS?. fuentes externas. localitos. tablas sistemas distribuidos. DB2. Funcionales ¿Qué tipos de fuentes NO son aceptadas como TDS?. fuentes externas. localitos. tablas sistemas distribuidos. DB2. Funcionales ¿Cómo está constituido el contrato?. Entidad + Oficina + Producto + Cuenta. Oficina + Producto + Cuenta + Entidad. Funcionales ¿Qué es RCD?. Reporte Crediticio de Deudores. Reporte Crediticio de Deudores y no deudores. Funcionales ¿Qué es RDD?. Resilient Distributed Datasets. Resilient Distribuestrucentted Data. Funcionales Como se define un RDD. Un RDD es un dataset. Un RDD es una estructura de datos distribuida. RDD es un paradigma de programación. RDD es una base de datos. Ninguna opción es correcta. Funcionales ¿En qué documento se registran la estructura de los campos?. Estructura a formatear. otros. Funcionales cuando te preguntan cuantos digitos tiene un contrato. 18 digitos. 16 digitos. Funcionales La abstracción de core de Spark. Dataset. DataStream. Block. RDD. Funcionales Qué modelo global tiene una solución técnica para la ingesta en Datio. Utiliza una tabla temporal local con nomenclatura _lcl que contiene la lógica de carga de su procesamiento y en algunos casos también utilizan tablas técnicas auxiliares. Modelo Alpha (LCL es Alpha). Modelo de CIB. Todas las anteriores. Modelo Client Solutions. Modelo de CDD. Funcionales Cuando se utiliza cualquier operación de descifrado, el modo por defecto para la detección de errores es: KEEP FAILED. MASK_FAILED. N.A. FAIL FAST. Funcionales En los casos de Out-Staging, es necesario modificar la propiedad “kind” a “egression”: FALSO. VERDADERO. Funcionales A qué se denomina campos multifuncionales: Campos que tienen datos sensibles. Campos que contienen varios datos funcionales. Campos no utilizados. Campos que contienen diferentes interpretaciones funcionales. Funcionales ¿El caché es una técnica de optimización?. Depende si es un DataFrame o un RDD. Si. No. Dependen del clúster. Funcionales ¿Cuáles de las siguientes son características comunes de RDD y DataSet?. Inmutabilidad. Resilenciarddparadigma. Todas las anteriores. En memoria. Funcionales ¿Cuáles de las siguientes son características comunes de RDD y DataFrame?. Inmutabilidad. Resilencia. Todas las anteriores. En memoria. Funcionales El alcance de los datos que requiere un proyecto en Datio nace en el registro en: BUI. MSA. Ficha de Proyecto. Tablero de Ingesta. BUC. Funcionales ¿Cuál es la finalidad de la ficha de proyecto?. Definir los datos de salida del proyecto. Definir el alcance global del proyecto. Ninguna de las anteriores. Funcionales Se aplica el tokenizado en los archivos de configuración de RAW o MASTER. VERDADERO. FALSO. Funcionales Para solicitar a CA se envían tickets de tipo _____ y agrupadas con una ____ que se ha planificado al inicio del Q. Target - Historia. Historia - Subtarea. Dependencia - Subtarea. Subtarea - Dependencia. Funcionales Los RDD son tolerantes a fallos gracias a: Inmutabilidad. DAG. Evaluación Lazy. Ninguna. Funcionales Para certificar una fuente de origen launchpad, para asignar el ID TDS. MSA. Muestra productiva. Descripción funcional detallada y origen launchpad. Información de folio. Datos de la solicitud de la HU. Todas las opciones. Funcionales Para el origen “Host-ad-hoc” qué sucesión se debe adjuntar para la certificación del ID de la TDS. Correo de holding, indicando que la tabla ya se encuentra productiva. Solo aprobación de core data. Diagrama de flujo,correo del vobo del SO y DO, aprobación de core data. Todas las respuestas son correctas. JCL donde se pueda observar el query de descarga y el nombre del fichero. Funcionales El nombre de un folder está compuesto por AA-PPCCCBBB-DDD, donde CCC hace referencia a : Clave Aplicativa. NA. Periodicidad. Funcionales Cómo bloquear la malla para evitar que otra persona la utilice al mismo tiempo que tú la usas. Check out. Check in. blocked. ninguna opción es correcta. Funcionales ¿Qué tipo de origen tiene que pasar por mesa de data y tiene que ser validado por el Solution Architect?. Oracle. Launchpad. Host. Distribuido. Funcionales No es una característica de una TDS. Esta fuente tiene soporte de ingenieria. Fuente de Información donde nace o se crea el dato. Los datos que contienen son fiable. Contiene los datos requeridos por un proyecto. Funcionales Una vez terminado el proceso de diccionario con arquitectura de datos, ya se puede enviar la revision de un dictamen de procesamiento?. Verdadero. Falso. Funcionales El selectColumn se utiliza para: Todas correctas. Mantener el orden segun Datum. Agregar campos. Funcionales En qué etapa se valida con el aplicativo si un campo en origen es usado o no: Diagnóstico de Dato. Relevamiento funcional técnico. Generación del excel de estructura. Diccionario de Datos. Funcionales: ¿En que capa de Datio se puede aplicar estas opciones de modelamiento? Separar un campo de varios campos independientes Unir dos fuentes en una sola. raw. solo en un master generado a partir de otros master. En la capa master. Staging, raw y master. Raw, Master. Funcionales: Son actividades de la etapa de Diagnostico de datos, excepto: Tomar como referencia la fuente sugerida en la ficha. Realizar el dictamen de nuevas fuentes. Usar la BUI, tablero de ingesta , Sophia e incluso realizar consultas en sandbox. Entender el Dato funcional solicitado en la Ficha. ¿Se define de la siguiente manera? - Pregunta ambigua. Map. Filter. Repartition. toda las anteriores. Según el Modelo de Seguridad un dato sensible se ingesta Tokenizado - Pregunta ambigua. no se ingesta. en claro. que parametros debo agregar para configurar un host en control M para que se ejecute a las 16:00 horas - pregunta ambigua. calendar. fetch. Segun el modelo de S y priv de datio en el sandbox L1T los habilitadores de fraude se tokenizan- ambigua. true. false. QUÉ EQUIPO TIENE LA TAREA DE CREAR UN TRANSFER - ambigua. La geografía que debe transmitir la información. no transmite. ARGOS ES LA SOLUCIÓN INTERNA PARA: - pregunta ambigua. DEBBUGEAR. compile. |