✒️SAP BI / BW BO Video - Creación de fuente de datos e infopaquete para textos de un dato maestro
SAP BI / BW BO Video - Creación de fuente de datos e infopaquete para textos de un dato maestro
En SAP BW existen diferentes objetos que se definen para implementar el proceso ETL que necesitamos. Se crean “Sistemas Fuentes” en donde se configuran las conexiones con los sistemas desde donde se obtendrá la información. También se crean “Fuentes de Datos”, en donde se indica específicamente que datos van a ser extraídos, aquí por ejemplo se podría especificar una tabla de una base de datos junto con los campos que queremos extraer. Estos datos de las Fuentes de Datos son extraídos primero dentro de las “PSA (Persistent Staging Area)” a través de los “InfoPackages”. Luego se crean “Transformaciones” que indican las operaciones que se le realizaran a los datos al pasar desde la PSA al “InfoProvider”, esta extracción se ejecuta a través de los “DTP (Data Transfer Process)”.
Para resumir, los objetos implicados en el proceso ETL en SAP BW (y que vamos a estar explicando en detalle en las próximas clases) son:
- Sistemas Fuentes (Source Systems)
- Fuentes de Datos (Data Sources)
- Extractores de Datos
- PSA (Persistent Staging Area)
- InfoPackages
- Transformaciones
- InfoProviders
- DTP (Data Transfer Process)
Las Fuentes de Datos en SAP BW, también llamadas Data Source, son la definición lógica de la estructura de los campos que serán extraídos desde el sistema fuente a SAP BW. Aquí se define qué información específica será extraída de un sistema fuente.
En una Fuente de Datos se definen aspectos tales como
- El nombre del archivo y la ubicación (en el caso de estar extrayendo datos desde un archivo plano hacia SAP BW).
- Tabla de la base de datos desde donde se desea extraer la información.
- Campos de la tabla que serán extraídos.
- Tipo, longitud, Key Figures y demás características de los campos que se desean extraer.
En el caso de que se desee tomar datos de SAP R/3 pero que no sea estándar, entonces deberá crearse primero un extractor de datos en SAP R/3 y luego incorporar la Fuente de Datos a BW sin necesidad de crearla desde cero. La acción de incorporar la fuente a BW se llama replicar metadatos.
En el caso de tratarse de una Fuente de Datos que tome datos estándar de SAP R/3 (en SAP cuando hablamos de estándar nos referimos a aquellos componentes del sistema que vienen en la instalación inicial sin hacerle ninguna modificación al sistema), no es necesario crear ni las Fuentes de Datos ni los Extractores desde cero, sino que ya vienen creadas de manera predefinida y lo que tendremos que hacer es activarlas y replicar metadatos para poder utilizarlas.
Es decir, tendremos 3 escenarios según el tipo de Sistema Fuente:
- El sistema fuente (sistema desde donde se obtendrá la información a extraer) es un sistema no SAP o un archivo: En este caso tendremos que crear la Fuente de datos.
- El sistema fuente es SAP R/3 estándar: En este caso solo deberá activarse la fuente de datos y luego replicar metadatos. (sin necesidad de crear el extractor en R/3).
- El sistema fuente es SAP pero no es estándar: en este caso deberá crearse el extractor desde el lado de R/3 y luego la fuente de datos podrá incorporarse a BW a través de la replicación de metadatos sin necesidad de crear la fuente de cero.
Hay cuatro tipos de Fuentes de Datos en SAP BW:
- Fuentes de Datos para datos transaccionales
- Fuentes de datos de Master Data:
- Fuentes de datos de atributos
- Fuentes de datos de textos
- Fuentes de datos de jerarquías
-
Los extractores de datos son programas que se encargan, como dice la palabra, de extraer los datos de SAP R3 y llevarlos a BW.
Existen dos tipos de Extractores de Datos:
- Extractores estándar (ya vienen con SAP y en ese caso hay que activarlos para poderlos utilizar en SAP BW).
- Extractores Genéricos, los cuales hay que crearlos en R3.
A su vez, dentro de los Extractores de Datos Genéricos, podemos encontrar tres tipos según de donde se obtiene la información dentro de R3:
- Tabla/Vista de SAP R3
- Desde una Query de SAP (También denominado InfoSet).
- Desde Módulos de Función.
Generalmente, los pasos siguientes en BW luego de crear los extractores en el lado de R3 son:
- Crear la fuente de datos en SAP BW replicando los metadatos.
- Crear el InfoPaquete para cargar la PSA de la Fuente de Datos.
- Crear el ODS/Infocubo a donde se va a guardar la información extraída.
- Crear la transformación entre el ODS/InfoCubo y la Fuente de Datos.
- Crear el DTP que ejecute el pasaje desde la PSA de la Fuente de Datos al ODS/InfoCubo.
-
La PSA en SAP BW, también llamada Persistent Staging Area, es un área donde se almacena la información extraída del sistema fuente y donde la misma permanece inalterable antes de ser transferida a los Cubos/ODSs (InfoProviders) de BW. Cuando decimos inalterable nos referimos a que por ejemplo la información en los Cubos puede estar agregada, sumarizada según alguna características o modificadas a través de una transformación, en cambio en la PSA, la información permanece almacenada tal cual estaba en el Sistema Fuente.
La ventaja de contar con un área de almacenamiento intermedio como la PSA, es justamente poder contar con un lugar dentro de BW donde la información este tal cual a como viene del sistema fuente, lo que nos facilitará el análisis de cualquier problema que detectemos luego cuando la información este almacenada y transformada en Cubos u ODSs.
Las tablas PSA existen para cada Fuente de Datos (Data Sources) y son creadas automáticamente por el sistema al activar la Fuente de Datos.
Las PSA se cargan a través de los Paquetes de Datos (InfoPackages
Los InfoPackages en SAP BW, también llamados InfoPaquetes, se utilizan para ejecutar la extracción de datos desde el sistema fuente (Source System) y cargarlo dentro de la PSA (Persistent Staging Area).
Adicionalmente de proveer la capacidad de ejecutar la extracción como dijimos anteriormente, los InfoPackages nos dan la capacidad de elegir parámetros de la extracción para filtrar los datos y que solo se extraigan aquellos que necesitamos. Por ejemplo, si estamos extrayendo datos de ventas de un sistema externo hacia BW, podríamos configurar el InfoPackage para que solo nos traiga los datos del mes de Octubre configurando el parámetro correspondiente a Fecha de Venta.
Al igual que la PSA, los InfoPaquetes pertenecen a una Fuente de Datos (DataSource) en particular, con la diferencia que los InfoPaquetes deben crearse manualmente mientras que la PSA se crea automáticamente al activar la fuente de datos.
Las transformaciones en SAP BW permiten consolidar, limpiar e integrar datos. Puede semánticamente sincronizar datos de fuentes heterogéneas.
Al cargar datos de un objeto fuente en otro objeto destino, los datos se pasan a través de una transformación. Una transformación convierte los campos de la fuente en el formato del destino.
Cuando hablamos de objetos fuentes estos pueden ser Fuentes de Datos, pero también pueden ser un ODSs, InfoCubos, etc. Es decir se pueden transferir datos desde una Fuente, un ODS o InfoCubo a otro ODS/InfoCubo siempre pasando por la transformación que es la que va a limpiar o transformar los datos de manera que sea consistente la fuente con el destino.
Los usos más frecuentes de las transformaciones son:
- Modificaciones, mejoras o agrupamiento de los datos cargados antes de escribirlos dentro de los infoProviders destinos, los cuales luego serán utilizados para el reporting.
- Actualizaciones condicionales de manera de estar seguros que solo la información necesaria será cargada en el infoProvider destino.
- Transformaciones de unidad, tiempo o moneda de la información que será cargada.
Una transformación consiste en al menos una regla de transformación. Varios tipos de reglas, tipos de transformación y tipos de rutinas están disponibles. Estos permiten crear desde transformaciones muy sencillas a complejas:
- Reglas de Transformación: Las reglas de transformación permiten asignar a cualquier número de campos de origen por lo menos un campo de destino. Se pueden utilizar diferentes tipos de reglas para esto.
- Tipo de Regla: Un tipo de regla es una operación específica que se aplica a los campos cuando se ejecute la carga de datos y los mismos pasen a través de la transformación. Los tipos de reglas son:
- Asignación directa.
- Formula
- Rutina
- Rutina con unidad.
- Tipo de transformación: El tipo de transformación determina cómo se escriben los datos en los campos destino.
- Grupo Regla: Un grupo de reglas es un grupo de reglas de transformación. Los grupos de reglas le permiten combinar varias reglas.
- Rutina: Se utilizan rutinas para implementar la transformación compleja a través de código ABAP. Las rutinas están disponibles como un tipo de regla. También hay tipos de rutinas que se pueden utilizar para implementar transformaciones adicionales.
 
 
 
Agradecimiento:
Ha agradecido este aporte: Osvaldo Cabak
Favorito:
Está publicación ha sido agregada a sus favoritos por: Leonardo Jochoian
Sobre el autor
Publicación académica de Mary Galicia, en su ámbito de estudios para la Carrera Consultor en SAP BI / BW BO.
Mary Galicia
Profesión: Ingeniero en Informatica - Venezuela - Legajo: JZ82V
✒️Autor de: 47 Publicaciones Académicas
🎓Egresado del módulo:
Disponibilidad Laboral: FullTime
Certificación Académica de Mary Galicia