✒️SAP BI / BW BO Introducción al ETL
SAP BI / BW BO Introducción al ETL
ETL (Extracción, Transformación, carga)
Tambien llamado flujo de datos que son los pasos que deben seguir los datos en su estado inicial (sistema fuente) para que sean extraídos, transformados y finalmente cargados en nuestro sistema SAP BI.
Extracción: extraer los datos del sistema origen.
La mayoria de los proyectos que se realizan para generar un Datawarehouse obtiene datos de diferentes sistemas, puede tener los datos de manera diferente sus datos, esto significa que puede tenerlos en ficheros Excel, en texto plano, en FIcheros XML, en base de datos relacionales, entre otros.
Busca obtener los datos y dejarlos listos para que se les pueda aplicar algún proceso de transformación.
Muy importante analizar los datos a extraer para determinar cuales son los que nos seran más útiles y cuales no.
Importante determinar el impacto que puede generar la extracción en el sistema fuente, ya que podría perjudicar a los sistemas transaccionales y por lo tanto complicar la operatoria diaria de la empresa.
Proceso de transformación: Adaptar los datos extraídos en datos que finalmente serán cargados en el Datawarehouse. Esta transformaciones serán adaptaciones de los datos basándose en reglas prestablecidas del negocio.
Modificaciones que pueden ocurrir.
- Códificar.
- Obtener nuevos valores.
- Generar campos claves en el destino de datos.
- Generar registros con cálculos totales.
- Armar varias columnas partiendo de sólo una o viceversa.
- Establecer qeu determinados campos que vengan con determinados tipos de datos sean convertidos.
Proceso de caraga: proceso en el cual los datos pasan por la fase de transformación y son cargados en nuestro sistema.
Existen diferentes maneras de cubrir los requerimientos, por ejemplo en algunos casos se sobre escriben los datos que se obtienen y en otros se va almacenando un historial de los registros de forma que se pueda conocer como fue variando un determinado valor a lo largo del tiempo.
Este proceso de carga puede pasar por varias capas hasta llegar al cubo.
Las cargas pueden ser realizadas de dos maneras.
- Cargas Full: Este tipo generalmente se realizan inicialmente y es cuando queremos que pasen todos los datos de la fuente al destino.
- Cargas Delta: sólo traeremos a nuestro sistema los datos que aún no fueron almacenados. Son imprescindibles, ya que sin ellas todas las veces que realizamos una carga, sobrecargaría al sistema fuente con esta solicitud.
Ventajas adicional del flujo 7.0. mejora de performance en las cargas ya que se pueden paralelizar los procesos, hacer mas sencillo el proceso de creación y mantenimiento del flujo desde la fuente de datos pasando por la trnasformación hasta el destino de datos y la mejora en el manejo de errores en caso de detectar registros erroneos en la PSA.
 
 
 
Sobre el autor
Publicación académica de Jorge Luis Leal Marquez, en su ámbito de estudios para la Carrera Consultor en SAP BI / BW BO.
Jorge Luis Leal Marquez
Profesión: Analista de Sistemas - Venezuela - Legajo: CD46R
✒️Autor de: 113 Publicaciones Académicas
🎓Egresado de los módulos:
- Carrera Consultor en SAP BI / BW BO Nivel Inicial
- Carrera Consultor ABAP Nivel Avanzado
- Carrera Consultor ABAP Nivel Inicial
Disponibilidad Laboral: PartTime
Presentación:
Profesional del ?rea de tecnol?gica, enfocado a garantizar la continuidad de las operaciones. consultor abap.
Certificación Académica de Jorge Leal