✒️SAP BI / BW BO Introducción al ETL
SAP BI / BW BO Introducción al ETL
PROCESO ETL
También se lo llama flujo de datos, que son los pasos que deben seguir los datos en su estado inicial (sistema fuente).
PROCESO DE EXTRACCIÓN: consiste en extraer los datos desde los sistemas de origen. La mayoría de los proyectos que se utilizan para generar datawarehouse obtienen datos provenientes de diferentes sistemas. Cada sistema puede tener almacenados sus datos de manera diferente (excel, xml, etc). Una parte importante de este proceso es analizar los datos a extraer, determinar los datos útiles y rechazar lo que no se utilizará. Algo importante al momento de analizar es determinar el impacto que puede generar esta extracción del sistema fuente, ya que podría perjudicar los sistemas transaccionales y por ende complicar la operatoria diaria de la empresa.
PROCESO DE TRANSFORMACIÓN: busca adaptar los datos extraídos en datos que finalmente serán cargados en el DW. Serán adaptaciones de los datos basándose en reglas preestablecidas del negocio.
- Codificar
- Obtener nuevos valores
- Generar campos claves en el destino de datos.
- Generar registros con cálculos totales.
- Armar varias columnas partiendo de sólo una o viceversa.
- Establecer que determinados campos vengan con determinados tipos de datos sean convertidos.
PROCESO DE CARGA: proceso en el cual los datos pasan por la fase de transformación y son cargados en nuestro sistema. Existen diferentes maneras de cubrir los requerimientos, por ejemplo en algunos casos se sobreescriben los datos que se obtienen y en otros se va almacenando un historial de los registros de forma que se pueda conocer como fue variando un determinado valor a lo largo del tiempo.
Pueden ser realizadas de dos maneras:
- Cargas Full: generalmente se realizan inicialmente y es cuando queremos que pasen todos los datos de la fuente al destino.
- Cargas Delta: solo traeremos a nuestro sistema los datos que aún no fueron almacenados. Son imprescindibles ya que sin ellas todas las veces que realizamos una carga, sobrecargaría al sistema fuente con esta solicitud.
 
 
 
Agradecimiento:
Ha agradecido este aporte: Osvaldo Cabak
Sobre el autor
Publicación académica de Alberto Martinez Bobadilla, en su ámbito de estudios para la Carrera Consultor en SAP BI / BW BO.
Alberto Martinez Bobadilla
Profesión: Administrador - Paraguay - Legajo: PT56Q
✒️Autor de: 49 Publicaciones Académicas
🎓Egresado del módulo:
Disponibilidad Laboral: FullTime
Certificación Académica de Alberto Martinez