🚀PROMO #PLANCARRERA2024 - 🔥Bonificaciones, Precios Congelados y Cuotas

 X 

✒️SAP BI / BW BO Introducción al Datawarehouse

SAP BI / BW BO Introducción al Datawarehouse

SAP BI / BW BO Introducción al Datawarehouse

Este tipo de modelo de datos consta principalmente de dos tipos de elementos:

  • DIMENSIONES: Representan factores por lo que se analiza un determinado área del negocio. Son pequeñas y usualmente están desnormalizadas.
  • HECHOS: Son el objeto de los análisis y están relacionados con las dimensiones. Son tablas muy grandes y suelen estar desnormalizadas. Se a menudo incluyen diferentes agregaciones como máximo, mínimo, media, …

Los hechos contiene los datos de estudio y las dimensiones contienen los metadatos sobre dichos hechos.

Si la información necesita disponer de varios niveles de granularidad se crean jerarquías con las dimensiones. Por ejemplo la jerarquía fecha podría ser “día – semana – mes – trimestre – año”.

Las jerarquías de las dimensiones presentan relaciones n-1 de manera que un valor de un nivel sólo puede ser agrupado por un único valor de cada nivel inmediatamente superior en la jerarquía. Esto facilita de manera rápida y sencilla el profundizar en el nivel de detalle (drill-down), disminuir el detalle(roll-up), selección (dice), proyección (slice) o pivotaje en las dimensiones (pivot), que son propios de los informes obtenidos a partir de data warehouse.

Diagrama en Estrella

Uno de los tipos de consultas más usadas en las OLAP es la llamada Estrella. Su nombre lo adquiere debido a que su implementación en un ambienterelacional (MOLAP Multidimentional Online Analitical Processing) está dado por varias tablas que almacenan las jerarquías dimensionales y una tabla que contiene el hecho con una relación 1:m con estas tablas de dimensiones. Veamos un ejemplo gráfico:

Figura 2: Diagrama en estrella del Hecho, Ventas. (Microsoft Data Warehouse Training Kit, 2000)

Como podemos ver en la figura las tablas de dimensiones están ligadas a la tabla Hecho, por relaciones. La integridad referencial es llevada a cabo por la creación de llaves foráneas en la tabla Hecho, que a su ves forman parte de la llave principal de la esta tabla. Es importante destacar que las jerarquías completas son guardadas en una sola tabla dimensión. Este es el formato no normalizado, existe otro formato que intenta normalizar estas tablas dimensión. Ejemplo (Time_Dim). Cada tabla dimensión tiene su propia llave que es mantenida por el sistema Data Warehouse. A estas llaves se les llama "Surrogate Key". Las llaves Surrogate Jerárquicas, no son más que una codificación de cada elemento de la jerarquía almacenado en la tabla dimensión. Veamos la figura 3 de cómo se logran estas llaves.

El término Datawarehouse fue acuñado por primera vez por Bill Inmon, y se traduce literalmente como almacén de datos. No obstante, y como cabe suponer, es mucho más que eso. Según definió el propio Bill Inmon, un datawarehouse se caracteriza por ser:

Integrado: los datos almacenados en el datawarehouse deben integrarse en una estructura consistente, por lo que las inconsistencias existentes entre los diversos sistemas operacionales deben ser eliminadas. La información suele estructurarse también en distintos niveles de detalle para adecuarse a las distintas necesidades de los usuarios

Temático: sólo los datos necesarios para el proceso de generación del conocimiento del negocio se integran desde el entorno operacional. Los datos se organizan por temas para facilitar su acceso y entendimiento por parte de los usuarios finales. Por ejemplo, todos los datos sobre clientes pueden ser consolidados en una única tabla del datawarehouse. De esta forma, las peticiones de información sobre clientes serán más fáciles de responder dado que toda la información reside en el mismo lugar.

Otra característica del datawarehouse es que contiene metadatos, es decir, datos sobre los datos. Los metadatos permiten saber la procedencia de la información, su periodicidad de refresco, su fiabilidad, forma de cálculo... etc.

Los metadatos serán los que permiten simplificar y automatizar la obtención de la información desde los sistemas operacionales a los sistemas informacionales.

Los objetivos que deben cumplir los metadatos, según el colectivo al que va dirigido, son:

Dar soporte a los responsables técnicos del datawarehouse en aspectos de auditoría, gestión de la información histórica, administración del datawarehouse, elaboración de programas de extracción de la información, especificación de las interfaces para la realimentación a los sistemas operacionales de los resultados obtenidos... etc.

Por último, destacar que para comprender íntegramente el concepto de datawarehouse, es importante entender cual es el proceso de construcción del mismo, denominado ETL (Extracción, Transformación y Carga), a partir de los sistemas operaciones de una compañía:

Extracción: obtención de información de las distintas fuentes tanto internas como externas.

Transformación: filtrado, limpieza, depuración, homogeneización y agrupación de la información.

Carga: organización y actualización de los datos y los metadatos en la base de datos.


 

 

 


Sobre el autor

Publicación académica de Mary Galicia, en su ámbito de estudios para la Carrera Consultor en SAP BI / BW BO.

SAP Senior

Mary Galicia

Profesión: Ingeniero en Informatica - Venezuela - Legajo: JZ82V

✒️Autor de: 47 Publicaciones Académicas

🎓Egresado del módulo:

Disponibilidad Laboral: FullTime

Certificación Académica de Mary Galicia

✒️+Comunidad Académica CVOSOFT

Continúe aprendiendo sobre el tema "Introducción al Datawarehouse" de la mano de nuestros alumnos.

Datawarehouse ---> almacen de datos --> proceso ETL (extraccion, transformacion y carga) Modelos de datawarehouse --> modelo estrella clasico y el modelo estrella extendido (usado por sap bi) La tabla de dimension, dentro del modelo estrella extendido, es llamada SID

Acceder a esta publicación

Creado y Compartido por: Rolando Aguilera Dreyse

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Expert


El DataWarehouse es un almacén de la información corporativa de la empresa derivada directamente de los sistemas operacionales y de otras fuentes externas de datos. En él se reflejan los datos claves de los procesos de negocio con el fin de soportar la toma de decisiones. El DataWarehouse se caracteriza por contener información: - Integrada - Orientada al negocio - De sólo lectura - Histórica Integración de datos de más de un sistema operacional: Los sistemas de DataWarehouse son más efectivos cuando pueden combinar datos desde más de un sistema operacional. Cuando los datos deben ser extraídos desde más de una aplicación fuente, es natural que esta...

Acceder a esta publicación

Creado y Compartido por: Juan Pablo Sadoly / Disponibilidad Laboral: FullTime

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Master

INTRODUCCION AL DATAWAREHOUSE 1. Que es y para que sirve un datawarehouse? -Datawarehouse (almacenamiento de datos) : Busca tener todos los datos de una empresa en un mismo lugar que ayude a la toma de decisiones -Para armar un datawarehouse se realiza un ETL (extraction, transformation and loading) -Es preciso concluir que BI permite a las empresas dar apoyo entorno a la toma de decisones mediante los indicadores KPI (Key Performance Indicators) 2. Modelos de datawarehouse 2.1 Modelo de estrella clasico: es el que se utiliza normalmente en las BD relacionales, esto se clasifica en dos grupos: -Los Hechos: son las medidas (cantidades) -Los atributos de Dimensiones: caracteristicas (clientes, materiales) 2.2 Modelo de estrella extendida...

Acceder a esta publicación

Creado y Compartido por: Vicmar Matilde Fernandez Medina

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Master

* Datawarehouse: Almacén de datos. Todo en un mismo lugar sin importar de que tipo de sistema proceda. Para la carga datos en un datawarehouse se utiliza lo que se llama proceso ETL (Extración, transformación y carga) Nivel de éxito/rendimiento se puede medir con KPIs (indicadores clave de rendimiento). BI da apoyo a la toma de decisiones a través del análisis de estos KPIs (nivel de ventas, cantidad de clientes..) * Modelos de datawarehouse: Estrella clásico: baja cantidad de op's para enlazar hechos y dimensiones; acceso muy eficiente. Estrella extendido: No almacena datos maestros dentro de las dimensiones. Usa claves INT4, DIM_ID que se generan automáticamente, más rápido...

Acceder a esta publicación

Creado y Compartido por: Alejandro López Robledano

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Master

Qué es y para qué se utliza un DataWarehouse (Almacén de datos): Un Datawarehouse es una base de datos corporativa que se caracteriza por integrar y depurar información de una o más fuentes distintas, para luego procesarla permitiendo su análisis desde infinidad de perpesctivas y con grandes velocidades de respuesta. La creación de un datawarehouse representa en la mayoría de las ocasiones el primer paso, desde el punto de vista técnico, para implantar una solución completa y fiable de Business Intelligence. SAP BI utiliza el módelo de datos estrella extendido Por qué SAP BI? Ya que este proporciona la funcionalidad de almacenamiento de datos, una plataforma...

Acceder a esta publicación

Creado y Compartido por: Andrés Felipe Domínguez Rendón

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Master

DataWarehouse (Almacén de Datos) Se llama almacén de datos porque busca obtener todos los datos de la empresa en un mismo lugar. Modelos de DataWarehouse: *Modelo Estrella Clásico: Modelo multidimensional que más se utiliza para bases de datos relacionales. Se clasifican en 2 grupos de datos que son los hechos y los atributos de dimensión. *Modelo Estrella Extendido: Hace tablas específicas de datos maestros y tendrán 1 a 3 tablas (atributos, textos y jerarquías); la relación entre ambas tablas se realizan a través de una tabla intermedia. Bussines Intelligence Estructuración y visualización de toda la información empresarial, se necesita un cuadro...

Acceder a esta publicación

Creado y Compartido por: Milton Bermúdez Muñoz / Disponibilidad Laboral: FullTime + Carta Presentación

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

Que es un Datawarehouse? (Almacén de datos) Busca centralizar todos los datos de una empresa. En un DW se busca que los datos de diferentes fuentes se almecenen de forma homogénea. Para llenar un datawarehose se utiliza comunmente un proceso de ETL. Modelos de Datawarehouse Estrella clásico El mas utilizado para bases de datos relacionales Busca clasificar los datos en dos grupos: 1- Los hechos(FACTS): Pueden ser valores de importe, cantidades etc. (Medidas) 2- Atributos de Dimensión: Caracteristicas de los hechos, tales como; Proveedor, cliente, tiempo, etc Estrella clásico Extendido No almacena datos maestros dentro de las dimensiones por lo que siempre...

Acceder a esta publicación

Creado y Compartido por: Rolando Barberi

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

Unidad 1: Introducción a SAP BI Introducción al Datawarehouse 1. ¿Qué es y para qué se utiliza un DataWarehouse? Almacén de datos. Se busca obtener todos los datos de una empresa en un mismo lugar, sin necesudad de que tipo de sistema provengan esos datos. Lo que se hace en un DW es que los datos de las diferentes fuentes de información queden de manera homogénea. Para el armado de un de un DW se realiza el proceso ETL (Extracción, Transformacion y Carga) Nivel de exito de las empresas depende del uso de los indicadores claves de rendimiento (KPI). Business Intelligence (BI): actividad, herramienta o proceso que permite a las empresas las toma de decisiones mediante los indicadores...

Acceder a esta publicación

Creado y Compartido por: Sebastian Gil Loaiza

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Senior

Datawarehouse: Almacen de datos centralizado de una compañia provenientes de cualquier origne de datos. Existen 2 modelos de datawarehouse Modelo Estrella clasico, formado por la tabla de hechos donde se almacenan los atributos valor y los ID's de las dimenisones involucradas y las tablas de dimensiones donde se almacenan las caracteristicas como el cliente, la zona de ventas, almacen, bodega, etc. Modelo Estrella extendido: En las tablas de dimensiones no se almacenan los valores de los datos de las dimensiones , si no que se hacen en tablas especificas una para los atributos, otra para los textos y otra para las jerarquias, ademas de una tabla intermedia que almacena los Id's para unir estas tres tablas llamad SID, no necesariamente...

Acceder a esta publicación

Creado y Compartido por: Sor Leticia Palacio Agudelo

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Senior

DataWarehouse Es un almacén de Datos, se llama así porque obtiene datos de una empresa venga del sistema que venga. Para qué usamos un datawarehouse? Lo usamos cuando hemos cambiado de sistema y necesitamos obtener los datos del sistema anterior (Datos históricos) Tambien lo usamos cuando se han adquirido empresas que ya contaban con su sistema local y han migrado al nuestro, esa data se la almacena en un datawarehouse (datos de terceros) Además lo que se hace en un Datawarehouse es que los datos que vienen de diferentes fuentes de información con diferentes códigos pero que se refieren al mismo objeto, queden homogéneos gracias al proceso ETL (Extracción, Transformación y...

Acceder a esta publicación

Creado y Compartido por: Anabel Soleto Olguin

 


 

👌Genial!, estos fueron los últimos artículos sobre más de 79.000 publicaciones académicas abiertas, libres y gratuitas compartidas con la comunidad, para acceder a ellas le dejamos el enlace a CVOPEN ACADEMY.

Buscador de Publicaciones:

 


 

No sea Juan... Solo podrá llegar alto si realiza su formación con los mejores!