✒️SAP BI / BW BO Introducción al ETL
SAP BI / BW BO Introducción al ETL
Proceso ETL : tambien llamado flujo de datos, son pasos que deben seguir los datos en su estado inicial (sistema fuente) para que sean extraidos, transformados y finalmente cargados a nuestro sistema BI.
* Extraccion : extraer datos desde los sistema de origen que pueden ser diferentes sistemas, que pueden tener los datos almacenados de maneras diferentes, busca obtener los datos y dejarlos listos para que se les pueda aplicar el proceso de transformacion, se debe filtrar los datos con el fin de determinar que datos se debe traer separando los innecesarios, tambien se debe tener en cuenta el impacto que el proceso de extraccion cause en los sistema de origen, ya que dependiendo de la cantidad de datos puede causar lentitud u otros inconvenientes, para esto se determinan tambien horarios o cortes de la informacion.
* Transformacion : busca adaptar los datos extraidos en datos que finalmente seran cargados en el DW, deben manejar ciertas reglas
- Codficar, establecer codigo especificos
- Obtener nuevos valores, se pueden crear campos con operaciones matematicas que permitan hallar un nuevo valor de los que se traen del sistema de origen.
- Generar campos claves en el destino de datos, se pueden crear campos que permitan identificar el origen del sistema de donde se extraen y codicar con luego con una numeracion especifica, ej SAP00001, EXC0001 etc.
- Generar registros con calculos totales, esto sirve cuando se quiere tener almacenado por ej los totales de ventas por cuidad.
- Armar varias columnas partiendo de solo una o viceversa, ej nombre = "Diana", apellido = "Peña" en la DW se crea un solo campo nombre_completo = "Diana Peña".
- Establecer que determinados campos vengan con determinados tipos de datos convertidos, ej nombre = "Diana@Peña" se hace una codificacion en el campo, para que no traiga caracteres diferentes a letras y este sea reemplazado por espacio, quedando nombre = "Diana Peña".
* Carga: es el proceso en el cual los datos pasan por la fase de transformacion y son cargados en nuestro sistema, existen dos maneras de cubrir los requerimientos, sobreescribiendo o almacenando historial, dependiendo de los que se requiera, en el caso de sobreescribir en caso de que se necesite verificar un dato diario, es decir no necesitamos el historial, y en caso del almacenando historial cuando vamos guardando el valor diariamente para luego obtener el valor acumulado en determinado tiempo.
- Cargas full: es cuando queremos que pasen todos los datos de la fuente al destino
- Cargas delta: solo cargaremos al sistema los datos que aun no fueron almacenados
* La tabla PSA es la tabla vinculada a una fuente de datos y posee la misma estructura de campos definidas en la fuente de datos. Allí se almacenan todas las peticiones que se vayan cargando.
 
 
 
Sobre el autor
Publicación académica de Diana Patricia Pena De Lannoy, en su ámbito de estudios para la Carrera Consultor en SAP BI / BW BO.
Diana Patricia Pena De Lannoy
Colombia - Legajo: ZN14G
✒️Autor de: 4 Publicaciones Académicas
🎓Cursando Actualmente: Consultor en SAP BI / BW BO Nivel Inicial
🎓Egresado del módulo:
Certificación Académica de Diana Pena