✒️SAP BI / BW BO Introducción al ETL
SAP BI / BW BO Introducción al ETL
Proceso ETL (Extraccion, Transformacion y Carga) = Flujo de Datos = proceso por el cual los datos en su estado inicial son extraidos del sistema fuente para luego ser transformados y finalmente cargados en nuestro sistema SAP BI
Extraccion: se extraen los datos desde los sistemas de origen sin importar las diferentes formas de almacenamiento de los mismos en sus respectivos sistemas (ficheros Excel, texto plano, fichero XML, bases de datos relacionales, etc). El objetivo de este proceso es dejar los datos listos para el siguiente proceso (Transformacion), para esto se deben analizar los datos a extraer y determinar cuales nos seran utiles y cuales no, y asi evitar datos innecesarios en nuestro sistema. Tambien se debe determinar el impacto generado por dichas extracciones en el sistema fuente, pudiendo perjudicar los sistemas transaccionales y por lo tanto complicar la operatoria diaria de la empresa.
Transformacion: adaptacion de los datos anteriormente extraidos en datos que seran cargados en el Datawarehouse. Las adaptaciones seguiran reglas preestablecidas por el negocio. Algunas modificaciones son:
- Codificacion: por ejemplo almacenar el producto CHOCOLATE como CH
- Obtencion de nuevos valores: por ejemplo Importe_total = importe_producto impuestos
- Generar campos claves en el destino de datos: en varios sistemas un producto es llamado de formas diferentes entonces se establece un nuevo codigo de identificacion univoco para todos y al mismo tiempo se busa identificar de que sistema nos llega la informacion, entonces por ejemplo se establece un campo clave producto (formado por 3 caracteres iniciales que indican de donde proviene) y un codigo que identifique el tipo de producto.
- Generar registros con calculos totales: por ejemplo almacenar los totales de ventas por ciudad
- Armado de varias columnas partiendo de una sola y veceversa.
- Conversion de campos que vengan con determinados tipos de datos: por ejemplo Nombre = ¨Juan#Lopez¨ con nuestra implementacion llega a nuestro sistema como Nombre = ¨Juan Lopez¨
Carga: proceso de carga de los datos tranformados en nuestro sistema. Segun los requerimientos, durante este proceso, o se sobreescriben los datos que se obtienen, o se almacenan para obtener un historial de registros y asi conocer como fue la variacion de un valor a lo largo del tiempo. Este proceso puede pasar por varias capas antes de llegar al Cubo. Las cargas pueden realizarse de 2 maneras:
- Cargas Full: generalmente realizadas inicialmente ya que su objetivo es pasar todos los datos del sistema fuente al sistema destino.
- Cargas Delta: solo se trae a nuestro sistema los datos que aun no fueron almacenados. Son imprescindibles debido a que sin ellas se sobrecargaria el sistema fuente al momento de realizar una carga.
 
 
 
Agradecimiento:
Ha agradecido este aporte: Victor Zavala Quispe
2 Favoritos:
Está publicación ha sido agregada a sus favoritos por: Jorge Herrera, Victor Zavala Quispe
Sobre el autor
Publicación académica de Milton Ezequiel Bravo, en su ámbito de estudios para la Carrera Consultor en SAP BI / BW BO.
Milton Ezequiel Bravo
Profesión: Project Manager en Newbitcrew - Argentina - Legajo: HQ58N
✒️Autor de: 50 Publicaciones Académicas
🎓Egresado de los módulos:
Disponibilidad Laboral: FullTime
Certificación Académica de Milton Bravo