PROMO JULIO en CVOSOFT United States Of America: 💎Calidad, 🔥Bonificaciones, 🥶Precios Congelados y MÁS!

 X 

✒️SAP BI / BW BO Introducción al ETL

SAP BI / BW BO Introducción al ETL

SAP BI / BW BO Introducción al ETL

1.- Procesos ETL (Extract, Transform and Load - Extraccion, transformacion y carga) de datos

También conocido como flujo de datos, los cuales corresponden a los pasos que deben seguir los datos en su estado inicial, sistema fuente, para que sean extraídos, transformados y finalmente cargados en nuestro sistema, caso de estudio SAP BI. En resumen, tendremos un dato inicial "crudo" proveniente de nuestro sistema fuente/base para luego realizar las transformaciones del dato necesarios; union, desunion, eliminacion de caracteres especiales, etc para luego ser cargados en nuestras tablas del modelo de datos final.

2.- Proceso de Extracción

Este proceso es el paso inicial de un ETL, el cual consiste en recuperar/leer/extraer los datos desde los sistemas fuentes/origen/base.

Los sistemas fuentes pueden ser de diferentes tipos; por ejemplo archivos Excel, de texto plano, XML, bases de datos relacionales, etc.

La función principal del proceso de extracción es la de poner a disposición los datos útiles, desde los sistemas fuentes antes mencionados, para que luego sean "manipulados" por el siguiente proceso llamado Transformación.

Dato importante en este paso es siempre considerar que los datos deben ser útiles, para lo cual es necesario realizar un análisis previos de cuales serán considerados y cuales no, como también de la carga/volumen de datos que serán extraídos para no afectar el diario comportamiento de los sistemas de la empresa, esto cuando el sistema fuente es una base transaccional.

3.- Proceso de Transformación

Tal como lo dice la palabra, en este paso se realizará la transformación de los datos, habilitados en el proceso anterior de extracción, para luego darle un valor agregado con respecto a las reglas del negocio, esto se puede considerar en seis puntos bases, los cuales serán:

* Codificación: asignación de una nomenclatura/abreviación a una palabra/detalle/concepto empresarial. ejemplo chocolate = CH

* Cálculos: Realizar cálculos en base a dos o mas variables, ejemplo valor total = valor inicial + valor final

* Llaves primarias: Asignar un identificador único al registro que se esta cargando, por ejemplo cuando se consideran varios orígenes de datos, pero no existe una "norma" en cuanto a la definición de los mismos, en este punto, se puede hacer la diferenciación, por ejemplo datos cargados del sistema fuente A, queda con la asignación 1 y los del sistema fuente B con la asignación 2 y así sucesivamente.

* Agrupación: generación de registros con cálculos totales, por ejemplo se agrupan los datos para obtener las ventas por ciudad.

* Concatenación: Acción de unir dos o mas palabras para generar una sola, ejemplos los nombres con los apellidos, la dirección completa de un lugar, etc.

¨Limpieza: Eliminación de todo caracter "extraño" en los datos existentes, para no "arrastrar" estas "basuras" en los datos y que pueda ser perjudicial o entorpecer el proceso de análisis final.

4.- Proceso de Carga

Este paso corresponde a la realización de la carga de los datos, ya extraídos y posteriormente transformados, en nuestro sistema final, el cual puede ser un cubo de datos o una ODS.

Las cargas de datos pueden ser realizadas de 2 maneras:

* Cargas Full: Como lo indica la palabra, se carga todo desde el sistema fuente al sistema destino.

* Cargas Delta: A diferencia de la carga full, la carga delta solo cargara los datos que aún no han sido almacenados.

Punto a favor de la carga delta es que "aliviana" el proceso de carga del sistema fuente ya que no realizaría una sobre carga del sistema a diferencia de lo que si podría ocurrir con una carga full.

DATAWAREHOUSE: Es un repositorio de la información transaccional obtenida desde los sistemas de gestión (incluido SAP ERP), organizada de tal manera que se adapte mejor a las necesidades de reportes, disminuyendo los tiempos de consulta y optimizando el uso de recursos de hardware. Las fuentes de información de un datawarehouse puede que provenga de la propia plataforma SAP instalada, o bien de fuentes externas como ser datos provenientes de la web, aplicaciones externas, documentaciones anexadas etc.


 

 

 


Sobre el autor

Publicación académica de Mauricio Osenga Vasquez, en su ámbito de estudios para la Carrera Consultor en SAP BI / BW BO.

SAP Senior

Mauricio Osenga Vasquez

Profesión: Ingeniero Informatico - Chile - Legajo: XR81O

✒️Autor de: 46 Publicaciones Académicas

🎓Cursando Actualmente: Consultor en SAP BI / BW BO Nivel Avanzado

🎓Egresado del módulo:

Certificación Académica de Mauricio Osenga

✒️+Comunidad Académica CVOSOFT

Continúe aprendiendo sobre el tema "Introducción al ETL" de la mano de nuestros alumnos.

SAP SemiSenior

Unidad 2: Proceso de ETL Lección: Introducción al ETL 1. Proceso ETL Llamado tambien Flujo de Datos. Extracción, transformación y carga en SAP BI. 2. Proceso de Extracción Busca inicialmente obtener datos y dejarlos listos para que se pueda aplicar algun proceso de transformación. Debe existir una fase de análisis. Determinar impacto para evitar afectar el sistema fuente, generalmente son sistemas transaccionales. Proceso de Transformación Busca adaptar los datos extraídos que finalmente serán cargados en el DW. Adaptaciones de los datos basándose en reglas preestablecidas del negocio. - Codificar - Obtener nuevos valores - Generar campos claves - Generar registros...

Acceder a esta publicación

Creado y Compartido por: Sebastian Gil Loaiza

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Senior

Introducción al proceso ETL (Extract, Transformation, Load) Tambien se le puede llamar Flujo de datos, es el proceso que debemos realizar para tomar los datos que necesitamos de los sistemas fuentes, transformarlos y cargarlos a la bodega de datos, en nuestro caso SAP BI. Extracción: Es el proceso de extraer los datos que necesitamos llevar a la bodega de datos y que se encuentran en los sistemas origen. A tener en cuenta el momento en que realizamos la extracción de los sistemas origen para no afectar la transaccionalidad de éstos (por lo general se programa para que este proceso se realice en la madrugada) Transformación: Es el proceso de realizar la transformación de los datos que extraímos...

Acceder a esta publicación

Creado y Compartido por: Omar Fabian Gamboa Hernandez

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Senior

Introducción al Proceso ETL Proceso ETL. Tambien llamado flujo de datos, que son los pasos que deben seguir los datos en su estado inicial(Sistema Fuente) para que sean extraidos, transformados y finalmente cagados en SAP BI. Proceso de Extracción: Es la primera parte en el proceso de ETL, consiste en extraer los datos desde los sistemas de origen. La extracción busca en primer momento obtener loa datos y dejarlos listos para que se les pueda aplicar algún proceso de transformación. Parte importante en este proceso es que se deben analizar los datos a extraer para determinar cuales son útiles o cuales no. Importante determinar el impacto que puede generar esta extracción en el sistema fuente...

Acceder a esta publicación

Creado y Compartido por: Rafael Monterrey

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

Un punto importante en el proceso ETL es determinar cuales datos son los ideales para el Datawarehouse ya que no se deben llevar natos innecesarios por su almacenaje. En ETL se debe planificar la extraccion de datos para no afectar el sistema transaccional diario y la operación, coordinar horas y fechas de procesos ojala en horarios no laborales. La codificación o estandarización de los codigos de productos juegan un papel importante en la extracción, procesamiento y carga de datos, se pueden colocar codigos nemotécnicos para determinar de donde provenía por ejemplo el material inicialmente.

Acceder a esta publicación

Creado y Compartido por: Tomas Chapal Contecha

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

opcion 1 ,etl=ETL -Es el proceso que permite a las organizaciones mover datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otro repositorio para apoyar procesos de negocios. -etl= flujo de datos= diferentes sistemas fuentes(base de datos), los datos son extraidos,transformados y finalmente cargados en sap bi. -psa=PSA La PSA (Persistent Staging Area=Área de organización persistente) es la área de almacenamiento de entrada de datos proveniente del sistema fuente dentro del sistema SAP BI. Las peticiones de datos son almacenadas sin realizar cambios desde el sistema fuente. -dtp: DTP Objeto SAP BI. Un DTP determina cuántos datos son transferidos entre dos objetos SAP...

Acceder a esta publicación

Creado y Compartido por: Harold Mauricio Castillo Diaz

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

Proceso ETL = Flujo de datos. El proceso ETL está constituido por los pasos que deben seguir los datos en su estado inicial (sistema fuente) para que sean extraídos, transformados y cargados en SAP BW. Proceso de Extracción: Aquí se extraen los datos desde los sistemas fuente, hay que tomar en cuenta que un Datawarehouse puede estar formado por datos provenientes de diferentes sistemas fuente, una parte muy importante en este proceso es que se deben analizar los datos a extraer para ver cuales nos pueden ser útiles y cuales no y así evitar datos innecesarios en nuestro sistema, también se debe tomar en cuenta cual es el impacto que genera una extracción de datos en el sistema fuente,...

Acceder a esta publicación

Creado y Compartido por: Jose Daniel Gomez Durand

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Senior

ETL = Extracción, transformación y Carga: Extracción: Se obtienen los datos de los sistemas fuentes (SAP, NO SAP) hacia el PSA Transformación: se aplican reglas,procedimientos, filtros de la información. Carga: es pasar la información del PSA a nuestro DW (ODS o Cubos) , Existe carga Delta y Carga Full. Carga Inicial: trae casi una replica de la tabla del sistema hacia el DW Carga Delta: trae solo información que aún no tenemos en el DW

Acceder a esta publicación

Creado y Compartido por: Josué Zermeño Sánchez

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

La importancia del proceso ETL (extract - transform - load) radica en asegurar una calidad, consistencia de datos, la homogeneización de los datos de sistemas divergentes, para que de este modo puedan ser utilizados de forma conjunta, procesando y transformando la información, con lo que finalmente se generan los datos en el formato apropiado para que puedan ser utilizados por las herramientas de analisis (business inteligence).

Acceder a esta publicación

Creado y Compartido por: Rolando Aguilera Dreyse

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

Proceso de ETL: Consiste en extraer información de diferentes fuentes de datos (Archivo planos, excel, bases de datos relacionales), realizar procesos de transformación en la cual se buscar adaptar los datos según las reglas de negocio y posteriormente ser cargados ya sea de manera en que se sobre escriben los datos existente o se va almacenando el historial y así poder identificar sus variaciones en el tiempo

Acceder a esta publicación

Creado y Compartido por: Leidy Joana Zuluaga Arcila

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Master

Proceso ETL (Extraccion, Transformacion y Carga) = Flujo de Datos = proceso por el cual los datos en su estado inicial son extraidos del sistema fuente para luego ser transformados y finalmente cargados en nuestro sistema SAP BI Extraccion: se extraen los datos desde los sistemas de origen sin importar las diferentes formas de almacenamiento de los mismos en sus respectivos sistemas (ficheros Excel, texto plano, fichero XML, bases de datos relacionales, etc). El objetivo de este proceso es dejar los datos listos para el siguiente proceso (Transformacion), para esto se deben analizar los datos a extraer y determinar cuales nos seran utiles y cuales no, y asi evitar datos innecesarios en nuestro sistema. Tambien se debe determinar el impacto generado...

Acceder a esta publicación

Creado y Compartido por: Milton Ezequiel Bravo / Disponibilidad Laboral: FullTime

 


 

👌Genial!, estos fueron los últimos artículos sobre más de 79.000 publicaciones académicas abiertas, libres y gratuitas compartidas con la comunidad, para acceder a ellas le dejamos el enlace a CVOPEN ACADEMY.

Buscador de Publicaciones:

 


 

No sea Juan... Solo podrá llegar alto si realiza su formación con los mejores!