opcion 1 ,etl=ETL
-Es el proceso que permite a las organizaciones mover datos desde múltiples fuentes,
reformatearlos y limpiarlos, y cargarlos en otro repositorio para apoyar procesos de
negocios.
-etl= flujo de datos= diferentes sistemas fuentes(base de datos), los datos
son extraidos,transformados y finalmente cargados en sap bi.
-psa=PSA
La PSA (Persistent Staging Area=Área de organización persistente) es la área de
almacenamiento de entrada de datos proveniente del sistema fuente dentro del sistema SAP
BI. Las peticiones de datos son almacenadas sin realizar cambios desde el sistema fuente.
-dtp:
DTP
Objeto SAP BI. Un DTP determina cuántos datos son transferidos entre dos objetos SAP BI
persistentes. Por ejemplo para pasar datos desde una Fuente de datos a un InfoCubo.
#2 proceso de extraccion
primera parte del proceso etl, consiste en extraer los datos desde los sistemas
de origen(sistemas fuentes)
- la mayoria de proyectos que se realizan para generar un datawarehouse,
obtienen datos provenientes de diferentes sistemas fuentes(EXCEL, TEXTO PLANO, BASE DE
DATOS RELACIONALES).(OJO).
-ANALIZAR LOS DATOS A EXTRAER PARA SABER CUALES SON LOS UTILES Y CUALES NO,
TENER CUIDADO CON LOS DATOS A EXTRAER.Para evitar datos innecesarios en
nuestro sistema.
-Otro item importante al realizar la extraccion en el sistema fuente,
ya que puede afectar los sistemas transaccionales y por lo tanto
perjudicar la parte operatoria de la empresa.
3# proceso de transformacion
busca adaptar los datos extraidos en datos que finalmente seran cargados en
un datawarehouese.
modificaciones que pueden ocurrir:
1.codificar chocolate se almacena CH
2.Importe_total = importe_producto impuestos.
3. establcer un nuevo codigo de identificacion univoco es decir de un solo significado,
ya que el codigo de indentificacion es diferente para todos los sistemas fuentes .
unívoco, ca
adj. y s. De un solo significado:
los términos científicos deben ser unívocos.
Que tiene igual naturaleza o valor que otra cosa.
ejemplo caramelos identificados con el valor 000321, por lo tanto
el campo producto, podria tener los siguientes valores para
determinar un mismo producto con su respectivo sistema fuente
SAP000321,FIL000321 FIL= ARCHIVO/FILE
EJEMPLO 2: Armar varias columnas partiendo de solo una o viceversa
se tiene los campos Nombre="juan", Apellido="lopez" y se almacena en un solo
campo = Nombre="juan lopez".No sirve la siguiente forma Nombre="juan#lopez"
4#. proceso de carga=
es el proceso en el cual los datos pasan por la fase de transformacion y son
cargados en nuestro sistema. Ese proceso de carga puede pasar por varias
capas hasta llegar al cubo.
cargas full: pasan todos los datos de la fuente al destino.
carga delta: son datos que aun no han sido almacenados, son imprescindibles
ya que sin ellas sobrecargariamos al sistema fuente con esta solicitud.