PROMO JULIO en CVOSOFT United States Of America: 💎Calidad, 🔥Bonificaciones, 🥶Precios Congelados y MÁS!

 X 

✒️SAP BI / BW BO Introducción al ETL

SAP BI / BW BO Introducción al ETL

SAP BI / BW BO Introducción al ETL

Proceso ETL

ETL - este termino viene de ingles de las siglas Extract-Transform-Load que significan Extraer, Transformar y Cargar y se refiere a los datos en una empresa. ETL es el proceso que organiza el flujo de los datos entre diferentes sistemas en una organización y aporta los métodos y herramientas necesarias para mover datos desde múltiples fuentes a un almacén de datos, reformatearlos, limpiarlos y cargarlos en otra base de datos, data mart ó bodega de datos. ETL forma parte de la Inteligencia Empresarial (Business Intelligence), también llamado “Gestión de los Datos” (Data Management).

La idea es que una aplicación ETL lea los datos primarios de unas bases de datos de sistemas principales, realice transformación, validación, el proceso cualitativo, filtración y al final escriba datos en el almacén y en este momento los datos son disponibles para analizar por los usuarios.

Fase extracción

Para realizar de manera correcta el proceso de extracción se deben seguir los siguientes pasos:

  • Extraer los datos desde los sistemas de origen.
  • Analizar los datos extraídos obteniendo un chequeo.
  • Interpretar este chequeo para verificar que los datos extraídos cumplen la pauta o estructura que se esperaba. Si no fuese así, los datos deberían ser rechazados.
  • Convertir los datos a un formato preparado para iniciar el proceso de transformación.

Además, una de las prevenciones más importantes a tomar en cuenta durante el proceso de extracción sería el exigir siempre que esta tarea cause un impacto mínimo en el sistema de origen. Este requisito se basa en la práctica, ya que si los datos a extraer son muchos, el sistema de origen se podría ralentizar e incluso colapsar, provocando que no pudiera volver a ser utilizado con normalidad para su uso cotidiano.

Fase de transformación

La fase de transformación de un proceso de ETL aplica una serie de reglas de negocio o funciones sobre los datos extraídos para convertirlos en datos que serán cargados. Estas directrices pueden ser declarativas, basarse en excepciones o restricciones, pero para potenciar su pragmatismo y eficacia es preciso asegurarse de que sean:

  • Declarativas.
  • Independientes.
  • Claras.
  • Inteligibles.
  • Con una finalidad útil para el negocio.

Proceso de carga

En esta etapa, los datos procedentes de la fase anterior (fase de transformación) son cargados en el sistema de destino. Dependiendo de los requerimientos de la organización, este proceso puede abarcar una amplia variedad de acciones diferentes.
Existen dos formas básicas de desarrollar el proceso de carga:

Acumulación simple

Esta manera de cargar los datos consiste en realizar un resumen de todas las transacciones comprendidas en el periodo seleccionado y transportar el resultado como una única transacción hacia el data warehouse, almacenando un valor calculado que consistirá típicamente en un sumatorio o un promedio de la magnitud considerada. Es la forma más sencilla y común de llevar a cabo el proceso de carga.

Rolling

Este proceso sería el recomendable en los casos donde se busque mantener varios niveles de granularidad. Para ello se almacena información resumida a distintos niveles, correspondiendo a distintas agrupaciones de la unidad de tiempo o diferentes niveles jerárquicos en alguna o varias de las dimensiones de la magnitud almacenada (por ejemplo, totales diarios, totales semanales, totales mensuales, etcétera).

Cualquiera que sea la manera de desarrollar este proceso, hay que tener en cuenta que esta fase interactúa directamente con la base de datos de destino, y por eso al realizar esta operación se aplicarán todas las restricciones que se hayan definido en esta. Si están bien definidas, la calidad de los datos en el proceso ETL estará garantizada.

¿Para qué sirve una herramienta ETL?

ETL es un instrumento potente que puede trabajar junto a otras herramientas de gestión e integración de datos para cumplir con los objetivos de nuestra compañía. Algunos casos de usos incluyen:

  • Migración de datos desde sistemas legacy con formatos de datos distintos.
  • Consolidación de datos como consecuencia de una fusión empresarial.
  • Recolección y fusión de datos desde proveedores o partners externos.
  • Integración de nuevas fuentes de datos como social media, videos, dispositivos conectados a internet de las cosas, entre otras.
  • Analítica “Self-Service” para ofrecer la posibilidad de hacer decisiones basadas en los datos a perfiles de negocio y sin conocimientos técnicos.
  • Integrarse con herramientas de Data Quality para asegurar que los datos sean confiables.
  • Trabajar con metadatos para permitir la trazabilidad de los datos.
  • Integrarse con sistemas transaccionales, almacenes de datos operativos, plataformas de Business Intelligence y sistemas de Master Data Management (MDM).
Principales beneficios de ETL

En resumen, los beneficios principales que una herramienta ETL puede proporcionar a nuestra empresas son:

  • Permitir extraer y consolidar datos de múltiples fuentes.
  • Proporcionar un contexto histórico profundo sobre nuestra empresa y negocio.
  • Facilitra el análisis y el reporte de datos de una forma sencilla y eficiente, mediante representación visual.
  • Aumentar la productividad y facilitar el trabajo en equipo.
  • Permitir adaptarse a la evolución de las tecnologías e integrar nuevas fuentes de datos con las tradicionales.
  • Permitir la toma de decisión estratégica basadas en datos por parte de los directivos de la empresa.

En definitiva, ETL nos pone en condición de poder extraer de ellos el conocimiento que nos pueda ayudar a solucionar nuestros problemas de negocio y ser verdaderas empresas data driven.

Desafíos de ETL

Los procesos ETL son fundamentales para cada empresa. Sin embargo, se encuentran con importantes retos que tienes que superar para adaptarse a las nuevas necesidades:

  • Procesamiento de datos en tiempo real. Cada día más se necesita tomar decisiones con mayor velocidad, lo que contrasta con el funcionamiento en batch de los sistemas ETL tradicionales, que tiene que adecuarse para operar lo más cercano posible al tiempo real.
  • Aumentar la velocidad del procesamiento de datos. El aumento tanto de la cantidad como de la complejidad de los datos, dificulta a veces las tareas de transformación. En este sentido, nación el concepto de ELT (Extract, Load and Transformation), que pospone la transformación en último lugar, realizándose ya en el sistema destino, y aprovechando de la potencia de cálculo del motor de la base de datos.
  • Integración de nuevas fuentes de datos. En la actualidad, las empresas necesitan acceder a todo tipo de fuentes de datos heterogéneas: videos, redes sociales y hasta datos generados por máquinas (Internet de las cosas). Por esto, las herramientas ETL necesitan evolucionar y agregar nuevas transformaciones para soportar estas nuevas fuentes de datos y las que vendrán en futuro.


 

 

 


Sobre el autor

Publicación académica de Mary Galicia, en su ámbito de estudios para la Carrera Consultor en SAP BI / BW BO.

SAP Senior

Mary Galicia

Profesión: Ingeniero en Informatica - Venezuela - Legajo: JZ82V

✒️Autor de: 47 Publicaciones Académicas

🎓Egresado del módulo:

Disponibilidad Laboral: FullTime

Certificación Académica de Mary Galicia

✒️+Comunidad Académica CVOSOFT

Continúe aprendiendo sobre el tema "Introducción al ETL" de la mano de nuestros alumnos.

SAP SemiSenior

Unidad 2: Proceso de ETL Lección: Introducción al ETL 1. Proceso ETL Llamado tambien Flujo de Datos. Extracción, transformación y carga en SAP BI. 2. Proceso de Extracción Busca inicialmente obtener datos y dejarlos listos para que se pueda aplicar algun proceso de transformación. Debe existir una fase de análisis. Determinar impacto para evitar afectar el sistema fuente, generalmente son sistemas transaccionales. Proceso de Transformación Busca adaptar los datos extraídos que finalmente serán cargados en el DW. Adaptaciones de los datos basándose en reglas preestablecidas del negocio. - Codificar - Obtener nuevos valores - Generar campos claves - Generar registros...

Acceder a esta publicación

Creado y Compartido por: Sebastian Gil Loaiza

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Senior

Introducción al proceso ETL (Extract, Transformation, Load) Tambien se le puede llamar Flujo de datos, es el proceso que debemos realizar para tomar los datos que necesitamos de los sistemas fuentes, transformarlos y cargarlos a la bodega de datos, en nuestro caso SAP BI. Extracción: Es el proceso de extraer los datos que necesitamos llevar a la bodega de datos y que se encuentran en los sistemas origen. A tener en cuenta el momento en que realizamos la extracción de los sistemas origen para no afectar la transaccionalidad de éstos (por lo general se programa para que este proceso se realice en la madrugada) Transformación: Es el proceso de realizar la transformación de los datos que extraímos...

Acceder a esta publicación

Creado y Compartido por: Omar Fabian Gamboa Hernandez

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Senior

Introducción al Proceso ETL Proceso ETL. Tambien llamado flujo de datos, que son los pasos que deben seguir los datos en su estado inicial(Sistema Fuente) para que sean extraidos, transformados y finalmente cagados en SAP BI. Proceso de Extracción: Es la primera parte en el proceso de ETL, consiste en extraer los datos desde los sistemas de origen. La extracción busca en primer momento obtener loa datos y dejarlos listos para que se les pueda aplicar algún proceso de transformación. Parte importante en este proceso es que se deben analizar los datos a extraer para determinar cuales son útiles o cuales no. Importante determinar el impacto que puede generar esta extracción en el sistema fuente...

Acceder a esta publicación

Creado y Compartido por: Rafael Monterrey

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

Un punto importante en el proceso ETL es determinar cuales datos son los ideales para el Datawarehouse ya que no se deben llevar natos innecesarios por su almacenaje. En ETL se debe planificar la extraccion de datos para no afectar el sistema transaccional diario y la operación, coordinar horas y fechas de procesos ojala en horarios no laborales. La codificación o estandarización de los codigos de productos juegan un papel importante en la extracción, procesamiento y carga de datos, se pueden colocar codigos nemotécnicos para determinar de donde provenía por ejemplo el material inicialmente.

Acceder a esta publicación

Creado y Compartido por: Tomas Chapal Contecha

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

opcion 1 ,etl=ETL -Es el proceso que permite a las organizaciones mover datos desde múltiples fuentes, reformatearlos y limpiarlos, y cargarlos en otro repositorio para apoyar procesos de negocios. -etl= flujo de datos= diferentes sistemas fuentes(base de datos), los datos son extraidos,transformados y finalmente cargados en sap bi. -psa=PSA La PSA (Persistent Staging Area=Área de organización persistente) es la área de almacenamiento de entrada de datos proveniente del sistema fuente dentro del sistema SAP BI. Las peticiones de datos son almacenadas sin realizar cambios desde el sistema fuente. -dtp: DTP Objeto SAP BI. Un DTP determina cuántos datos son transferidos entre dos objetos SAP...

Acceder a esta publicación

Creado y Compartido por: Harold Mauricio Castillo Diaz

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

Proceso ETL = Flujo de datos. El proceso ETL está constituido por los pasos que deben seguir los datos en su estado inicial (sistema fuente) para que sean extraídos, transformados y cargados en SAP BW. Proceso de Extracción: Aquí se extraen los datos desde los sistemas fuente, hay que tomar en cuenta que un Datawarehouse puede estar formado por datos provenientes de diferentes sistemas fuente, una parte muy importante en este proceso es que se deben analizar los datos a extraer para ver cuales nos pueden ser útiles y cuales no y así evitar datos innecesarios en nuestro sistema, también se debe tomar en cuenta cual es el impacto que genera una extracción de datos en el sistema fuente,...

Acceder a esta publicación

Creado y Compartido por: Jose Daniel Gomez Durand

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Senior

ETL = Extracción, transformación y Carga: Extracción: Se obtienen los datos de los sistemas fuentes (SAP, NO SAP) hacia el PSA Transformación: se aplican reglas,procedimientos, filtros de la información. Carga: es pasar la información del PSA a nuestro DW (ODS o Cubos) , Existe carga Delta y Carga Full. Carga Inicial: trae casi una replica de la tabla del sistema hacia el DW Carga Delta: trae solo información que aún no tenemos en el DW

Acceder a esta publicación

Creado y Compartido por: Josué Zermeño Sánchez

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

La importancia del proceso ETL (extract - transform - load) radica en asegurar una calidad, consistencia de datos, la homogeneización de los datos de sistemas divergentes, para que de este modo puedan ser utilizados de forma conjunta, procesando y transformando la información, con lo que finalmente se generan los datos en el formato apropiado para que puedan ser utilizados por las herramientas de analisis (business inteligence).

Acceder a esta publicación

Creado y Compartido por: Rolando Aguilera Dreyse

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

Proceso de ETL: Consiste en extraer información de diferentes fuentes de datos (Archivo planos, excel, bases de datos relacionales), realizar procesos de transformación en la cual se buscar adaptar los datos según las reglas de negocio y posteriormente ser cargados ya sea de manera en que se sobre escriben los datos existente o se va almacenando el historial y así poder identificar sus variaciones en el tiempo

Acceder a esta publicación

Creado y Compartido por: Leidy Joana Zuluaga Arcila

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Master

Proceso ETL (Extraccion, Transformacion y Carga) = Flujo de Datos = proceso por el cual los datos en su estado inicial son extraidos del sistema fuente para luego ser transformados y finalmente cargados en nuestro sistema SAP BI Extraccion: se extraen los datos desde los sistemas de origen sin importar las diferentes formas de almacenamiento de los mismos en sus respectivos sistemas (ficheros Excel, texto plano, fichero XML, bases de datos relacionales, etc). El objetivo de este proceso es dejar los datos listos para el siguiente proceso (Transformacion), para esto se deben analizar los datos a extraer y determinar cuales nos seran utiles y cuales no, y asi evitar datos innecesarios en nuestro sistema. Tambien se debe determinar el impacto generado...

Acceder a esta publicación

Creado y Compartido por: Milton Ezequiel Bravo / Disponibilidad Laboral: FullTime

 


 

👌Genial!, estos fueron los últimos artículos sobre más de 79.000 publicaciones académicas abiertas, libres y gratuitas compartidas con la comunidad, para acceder a ellas le dejamos el enlace a CVOPEN ACADEMY.

Buscador de Publicaciones:

 


 

No sea Juan... Solo podrá llegar alto si realiza su formación con los mejores!