✒️SAP BI / BW BO Introducción al ETL
SAP BI / BW BO Introducción al ETL
Unidad 2: Introducción al ETL
1. Proceso ETL
ETL también llamado flujo de datos, son los pasos que debe seguir la informacion (datos) contenbida en los sistemas fuentes (SAP y NO SAP), para que la misma sea extraida, transformada y cargada a nuestro sistema SAP BI
El flujo seria: FUENTES / area Staging / transformaciones / cargas (ODS y Cubos)
2. Proceso de Extracción:
La extracción puede ser de diferentes sistemas. (SAP y NO SAP)
El almancenamiento puede hacerse desde archivos excel, en texto plano, en ficheros XML, en bases de datos relacionales, entre otros.
La idea es obtener los datos y dejarlos listos para que se pueda aplicar algún proceso de transformación. Se deben analizar los datos a extraer y determinar cuales sera útiles y cuales no.
Al momento de realizar el análisis de la extracción que vamos a realizar, se debe determinar el impacto que puede generar la extracción en el sistema fuente, ya que podría perjudicar a los sistemas transaccionales y por lo tanto complicar la operatoria diaria de la empresa
3. Proceso de Transformación
Aqui se busca adaptar los datos extraídos en datos que finalmente seran cargados en el Datawarehouse. Estas transformaciones seran adaptaciones de los datos basandose en reglas preestablecidas del negocio.
Algunas de las modificaciones pueden ser:
- Codificar
- Obtener nuevos valores
- Generar campos claves en el destino de datos
- Generar registros con cálculos totales
- Armar varias columnas partiendo de sólo una o viceversa
- Establecer que determinados campos que vengan con determinados tipos de datos sean convertidos
4. Proceso de Carga
Es el proceso en el cual los datos pasan por la fase de Transformación y son cargados en nuestro sistema. Este proceso puede pasar por varias capas hasta llegar al cubo. Las cargas pueden ser realizadas de 2 formas:
- Cargas Full: Este tipo de cargas generalmente se realizan inicialmente y es cuando queremos que pasen todos los datos de la fuente al destino
- Cargas Delta: Con este tipo de cargas sólo traeremos a nuestro sistema los datos que aun no fueron almacenados. Las cargas deltas son imprescindibles, ya que sin ellas todas las veces que realizamos una carga, (full) sobrecargaría al sistema fuente con esta solicitud
7.0
Ventajas del flujo 7.0
- Mejora el performance en las cargas, ya que se pueden paralelizar los procesos
- Hacer mas sencillo el preoceso de creación y mantenimiento del flujo, pasando por la transformacion hasta el destino de datos
- Mejora en el manejo de errores en caso de detectar registros erroneos en la PSA (Permanent Staging Area)
 
 
 
Sobre el autor
Publicación académica de Vanessa Cristal Vera, en su ámbito de estudios para la Carrera Consultor en SAP BI / BW BO.
Vanessa Cristal Vera
Profesión: Ingeniero en Inform?tica - Venezuela - Legajo: SC34H
✒️Autor de: 47 Publicaciones Académicas
🎓Egresado de los módulos:
Presentación:
Sap businessobjects / inteligencia de negocios. profesional con 17 a?os de experiencia en las ?reas de seguros y telecomunicaciones. especialista en soluciones bi, manejo avanzado de herramientas sa
Certificación Académica de Vanessa Vera