✒️La plataforma SAP HANA
La plataforma SAP HANA
SAP HANA ( "High Performance Analytic Appliance") es una plataforma integrada de software y hardware que combina tecnologías de base de datos con la modalidad de procesamiento "in-memory", para soportar una nueva generación de aplicaciones de gran performance, entre las que se destacan las herramientas analíticas BI, BW con la promesa de lograr respuestas en tiempo real.
Caracterísiticas:
- Procesamiento de datos ultra rápido.
- Escalabilidad e innovación.
- Análisis de información en tiempo real.
- Recopilación de datos.
La primera versión de SAP HANA se lanzó en 2011 y si bien en un comienzo se hablaba de SAP HANA por versiones, el mismo no está "versionado" y provee innovaciones de manera automática cuando se lo actualiza.
En el año 2013 SAP HANA se desarrolló como plataforma, a la nueva base de datos se le implantaron los algoritmos clásicos del entorno ABAP, es decir los mecanismos de cálculo que se escribieron en el lenguaje de programación propio de SAP.
La mayor parte del software de SAP HANA fue escrito en el lenguaje de programación C++, de hecho, al compilar objetos de SAP HANA, éstos se convierten en código C++ y ésta en una de las principales razones por las que SAP HANA es tan rápido.
Una de las mayores ventajas de la plataforma es que ofrece una gran simplificación en cuanto a la gestión de procesos como son el modelado de datos, la experiencia del usuario, la toma de decisiones, los modelos y procesos de negocio y en cuanto a alineamiento con las últimas innovaciones tecnológicas tal como Big Data.
SAP HANA se puede implementar tanto on-premise como en la nube.
El objetivo principal de la plataforma es hacer que los procesos necesarios para el funcionamiento de una compañía sean más rápidos y estén más integrados. SAP HANA no se crea con la idea de acumular datos sino con la de concentrar aquellos que realmente nos puedan proporcionar información útil para el negocio.
Antes de la creación de SAP HANA, cada vez que una empresa decidía implementar SAP podía optar entre distintas bases de datos relacionales, siendo la más elegida, por su performance, Oracle. Entonces cada vez que se implementaba SAP también se implementaba Oracle, de manera que con el tiempo SAP se transformó en un vendedor de licencias de Oracle.
Una base de datos relacional se basa en el modelo relacional, una forma intuitiva y directa de representar datos en tablas. En este tipo de base de datos, cada fila de la tabla es un registro con un ID único, llamado clave. Las columnas de la tabla contienen atributos de los datos y cada registro generalmente tiene un valor para cada atributo, lo que facilita el establecimiento de las relaciones entre los puntos de datos.
Los principios de SAP HANA:
- El desafío de las aplicaciones analíticas: la explosión masiva de datos recolectados por las empresas se ha vuelto un verdadero problema, sobre todo en las organizaciones de mayor tamaño, por ello las soluciones de BI son una componente casi básica en la gestión de la información de cualquier tipo de organización. Las herramientas de BI y BW se basan en la utilización de extractores que replican datos de los sistemas trasaccionales y su posterior modelización en complejas estructuras n-dimensionales, que alimentarán las herramientas de análisis de BI. Dependiendo de la cantidad de datos en los sistemas fuente y la complejidad de las peticiones, la carga de procesamiento y los tiempos de esta metodología convencional pueden limitarse mucho ( por ejemplo, hay clientes cuyas bases de datos tienen 6 o 7 terabytes y necesitan procesamientos de horas).
- La tecnología "in-memory": con el avance en las tecnologías de las memorias RAM, surge la posibilidad de llevar todos los datos físicamente más cerca de la unidad central de proceso, es decir, alojando las bases de datos en memorias RAM de alta capacidad en lugar de hacerlo en discos, lo que se llama "in memory computing". Lo que ha popularizado las soluciones de este tipo en los últimos años es que los precios y las capacidad de las memorias las habilitan para un rango mucho más amplio de aplicaciones, pensando en memorias RAM capaces de alojar Terabytes de información. Al eliminar el acceso a discos, el procesamiento "in memory" genera tiempos de respuesta hasta 10.000 veces mejores y se pueden procesar datos a una velocidad de 100 GB por segundo. HANA almacena datos en disco y carga partes de las tablas de la base solicitadas en la memoria RAM. Cuando la memoria está agotada, HANA retirará de la memoria las tablas de la base que menos se utilizaron recientemente. En caso de un corte de suministro eléctrico SAP HANA escribe puntos de rescate en el disco a intervalos frecuentes los cuales contienen una instantánea que está en la memoria en los intervalos entre los puntos de salvaguarda. HANA guarda un registro de cada cambio de la base de datos a un disco flash rápido: Si se corta la luz, HANA guarda el último punto de salvaguarda y luego reproduce los registros de vuelta para asegurar la consistencia.
- Nuevas tecnologías en las bases de datos y procesamiento paralelo: las tecnologías innovadoras son otro pilar fundamental en el tratamiento de la base de datos. El almacenamiento de tablas base de datos por "columna" o "columnar" ofrece nuevas posibilidades de compresión de datos (se habla de una compresión de aproximadamente el 30%, lo que representa la tercera parte de su tamaño actual). Cuando se hace un tratamiento columnar de una tabla (una base de datos columnar es aquella que almacena todos los valores físicamente por columnas) físicamente todos los valores de la primera columna se ubican juntos, seguidos de las columna (campo 2),etc. Las instancias de cada columna se almacenan en el mismo orden de los registros por lo tanto la entrada número 30 de la primera columna y la entrada número 30 de la segunda columna pertenecen al mismo registro. Uno de los mayores beneficios del almacenamiento columnar es que puede ser fuertemente comprimido, lo que a su vez permite que las operaciones columnares se realicen muy rápido; por otro lado, en la disposición columnar, éstas están auto-indexadas lo que genera ahorro en el espacio de almacenamiento (comparado con un sistema relacional). SAP HANA soporta un tratamiento columnar como así también convencional.
- Por último, y gracias a lo mencionado anteriormente, SAP HANA incluye un eficiente mecanismo de replicación de datos a través del Sybase Replication Server, que "aspira" los datos del ERP casi en tiempo real, es decir, a medida que van ocurriendo, utilizando tecnología event-driven. Un sistema de tiempo real es aquel sistema informático que interacciona con su entorno físico y responde a los estímulos dentro de un plazo de tiempo determinado (no basta con que las acciones sean correctas sino que además deben ejecutarse en el tiempo determinado).
Los componentes de SAP HANA:
La arquitectura de la plataforma está compuesta principalmente de 4 componentes:
- SAP HANA Appliance: es la certificación que deben poseer los servidores y los componentes en los cuales se desee utilizar SAP HANA, ya que SAP no fabrica hardware a partir de ahora si lo certifica para su uso, dicha certificación tiene validez de compatibilidad para un grupo particular de fabricantes y equipos. La certificación es válida por el período de tiempo estipulado como se establece mediante un acuerdo de certificación de integración con el cliente, con fecha de validez de inicio y de caducidad, ésta última es necesaria ya que debido a que SAP HANA además de no poseer versionados, se actualiza constante y automáticamente para brindar un mejor servicio. De esta forma puede requerir futuras actualizaciones de software, las cuales pueden implicar modificaciones de hardware. La certificación es provista y realizada por los partners oficiales que la marca posee.
- SAP HANA DB: es la nueva tecnología que se encarga de manejar todo lo referente a la base de datos, aprovecha el najo costo de la memoria principal, la capacidad de procesamiento de datos y el rápido accedo a datos de las diferentes unidades para ofrecer un mayor rendimiento de las aplicaciones analíticas y transaccionales. Puede soportar tanto datos relacionales en fila y columna orientados a representaciones físicas como el tratamiento de gráficos y textos para la gestión de datos.
- SAP HANA Cloud Platform (HCP por sus siglas): es el componente que permite a las empresa y a los desarrolladores construir y administrar aplicaciones en SAP HANA desarrolladas para internet, las cuales estarán accesibles tanto en plataformas de escritorio como también desde medios móviles como tablets o celulares. Aporta la infraestructura para que las empresas puedan aprovechar la tendencia del IoT (internet de las cosas), que implica millones de dispositivos conectados a la red, simplificando los consumos móviles a través de una experiencia de usuario de calidad superior y un servicio suplementado de flujo de notificaciones.
- Las herramientas de modelado de la base de datos de SAP HANA: conjunto de herramientas que proporciona SAP para modelar la base de datos, dentro de las cuales encontramos: - SAP HANA Studio: permite a los usuarios técnicos administrar la base de datos SAP HANA, crear y administrar autorizaciones de usuario, crear nuevos o modificar modelos ya existentes, etc. - SAP Web IDE: es un entorno de desarrollo integrado basado en el navegador para el desarrollo de aplicaciones basadas en SAP HANA, que comprende modelos de datos de SAP HANA
 
 
 
Sobre el autor
Publicación académica de Santiago Acevedo, en su ámbito de estudios para el Carrera Consultor Basis NetWeaver.
Santiago Acevedo
Profesión: Data Scientist - Argentina - Legajo: EJ39N
✒️Autor de: 8 Publicaciones Académicas
🎓Egresado del módulo:
Disponibilidad Laboral: FullTime
Certificación Académica de Santiago Acevedo