✒️SAP BI / BW BO Introducción al ETL
SAP BI / BW BO Introducción al ETL
Proceso ETL
- se llama tambien flujo de datos (EXTRACCION, TRANSFORMACION, CARGA)
- son los passo que deben seguir los datos en su estado inicial o sistema fuenta para que sean extraidos, transformados y llevados finalmente al sistema BI
- Permite a las organizaciones mover datos de multiples plataformas, reformatear esos datos, y limpiarlos para que finalmente sean cargados a un nuevo repositorio y sirvan de apoyo a los procesos de negocio.
1. Extraccion
# consiste en extraer los datos desde los sistemas de origen, datos que provienen de diferentes sistemas.
# se busca obtener los datos y dejarlos listos para que se le pueda aplicar algun proceso de transformacion
# se analizan cuáles datos son serán utiles y cuales no
# Tambien se debe analziar el impacto de la extraccion en el sistema fuente para no coplicar la opetaroria diaria de la empresa.
2. Transformación:
# buscamos adaptar los datos extraidos (basandose en reglas del negocio), datos que luego seran cargados en nuestro Datawarehouse
# las modificaciones que pueden ocurrirle a los datos pueden ser:
- codificaciones (crear codigos para los materiales por ejemplo, unificando los nombres del material existente en diferentes sistemas fuentes)
- Obtener nuevos datos (ejemplo, obtener un importe total, que sea la suma de un producto mas un impuesto)
- Generar campos claves en el destino (por ejemplo un campo que identifique de qué sistema fuente se obtuvo el dato)
- generar registros con calculos totales (ejemplo, sumarizar ventas por ciudad)
- armar varias columnas a partir de una, o viceversa (caso de nombre y apellido)
- establecer que ciertos campos sean convertidos (Ejemplo, transformar un # a un espacio)
3. Carga:
# los datos que han pasado por la fase de transformacion son cargos en nuestro sistema.
# los datos puede sobreescribirse o bien puede almacenarse un historial de los registros, para ver fue variando un valor en el tiempo.
# puede pasar por varias capas hasta llegar a armarse el cubo.
# las cargas puede ser:
- FULL: se realizan generalemnte en un inicio (pasamos todos los datos del fuente al destino)
- DELTA: solo traemos datos que aun no fueron almacenados. Sin este tipo de carga sobrecargarias al sistema fuente.
Version 7.0 - Ventajas
- mejora de performance ne carga (maneja procesos en paralelo)
- menejo de errores.
- sencillez del flujo de transformacion de datos.
 
 
 
Sobre el autor
Publicación académica de Pamela Soledad Berardo, en su ámbito de estudios para la Carrera Consultor en SAP BI / BW BO.
Pamela Soledad Berardo
Profesión: Ing. en Sistemas de Informaci?n - Argentina - Legajo: FN96T
✒️Autor de: 82 Publicaciones Académicas
🎓Egresado de los módulos:
- Carrera Consultor en SAP PM
- Carrera Consultor en SAP PP
- Carrera Consultor en SAP BI / BW BO Nivel Inicial
- Carrera Consultor en SAP MM Nivel Avanzado
- Carrera Consultor en SAP MM Nivel Inicial
- Carrera Consultor en SAP SD Nivel Inicial