PROMO SEPTIEMBRE en CVOSOFT United States Of America: 💎Calidad, 🔥Bonificaciones, 🥶Precios Congelados y MÁS!

 X 

✒️ABAP HANA La búsqueda de textos y el análisis de datos no estructurados

ABAP HANA La búsqueda de textos y el análisis de datos no estructurados

ABAP HANA La búsqueda de textos y el análisis de datos no estructurados

Búsqueda de textos y el análisis de datos no estructurados

1. Las Ayudas de búsqueda y la búsqueda de textos en SAP HANA

  • La función de búsqueda de texto de Sap Hana permite desarrollar ayudas de búsqueda que funcionan de manera similar a las búsquedas modernas en Internet
  • Proporcionan cierta tolerancia a los errores y pueden procesar términos y sinónimos multilingües
  • A La búsqueda tolerante a errores se le conoce también como Búsqueda difusa o Fuzzy search

2. El reconocimiento de patrones en SAP HANA

  • La función de análisis de texto en SAP HANA nos permite realizar búsquedas dentro de los texto, y extraer información adicional de los textos, como las relaciones e incluso las intenciones o emociones dentro de los textos
  • El análisis de sentimientos es parte de la funcionalidad del motor de texto en SAP HANA y permite reconocer patrones en estos tipos de datos no estructurados

3. Características de la búsqueda de texto de SAP HANA

  • Búsqueda de estilo libre : No se requiere saber las columnas exactas de la base de datos
  • Búsqueda tolerante a errores (búsqueda difusa o fuzzy search) : Puede variar la ortografía ligeramente
  • Búsqueda lingüística y búsqueda de sinónimos : Incluye variantes lingüísticas y términos sinónimos
  • Sugerencia de valor : Identifica de manera eficiente los resultados de búsqueda probables mientras el usuario escribe y los presenta en tiempo real
  • Ranking de resultados : Los resultados de la búsqueda se optimizan para que los resultados con la tasa de probabilidad más alta se presenten en la parte superior de la lista
  • Facetas de búsqueda : Los resultados se cuentan y agrupan según criterios específicos
  • Análisis de texto (particularmente análisis de sentimiento) : Se extrae información adicional de los textos, permitiendo obtener información sobre aspectos semánticos

4. La búsqueda tolerante a errores

  • La búsqueda difusa o tolerante a errores (fuzzy search) implica la búsqueda de cadenas de caracteres en datos basados en texto, donde los datos no tienen que corresponder exactamente con la solicitud de búsqueda
  • Se usan algoritmos matemáticos que determinan el grado en que un registro de datos debe corresponder a la búsqueda
  • El resultado del cálculo es a menudo un valor numérico utilizado para decidir si un registro de datos es lo suficientemente similar a la solicitud de búsqueda
  • La función de búsqueda de texto en SAP HANA determina un valor entre 0 y 1 que marca el grado de similitud
  • Como programador, debemos definir un valor de umbral (por ej. 0,8) a partir del cual un valor del conjunto de datos que se ha buscado se clasifica de acuerdo con la solicitud
  • La búsqueda difusa también puede extenderse por listas de sinónimos, así, se puede almacenar una lista de términos que son equivalentes a un término específico
  • Otra opción para implementar una búsqueda más inteligente es familiarizar el sistema con las características semánticas de términos específicos. No todos los términos en una solicitud de búsqueda tienen la misma selectividad. Por esto es mas importante ingresar el nombre de una empresa similar y no ingresar un "S.A."
  • Cuando ejecutamos una solicitud de búsqueda en SAP HANA, podemos ingresar una lista de las llamadas Stop Words (Noise Words) que se consideran menos importantes que otras palabras

5. Los tipos de datos de texto y los índices de texto completo en Sap Hana

  • La búsqueda difusa en SAP HANA se basa en los tipos de datos del almacén de columnas
  • Los tipos de datos TEXT y SHORTTEXT se dedican a búsquedas de texto (y análisis de texto). TEXT representa un objeto grande, y SHORTTEXT se usa para cadenas de caracteres de una longitud determinada. Así, los textos se fragmentan internamente en tokens que forman la base para búsquedas y análisis
  • Los tipos de datos TEXT Y SHORTEXT no tienen soporte nativo en ABAP, por lo cual no se pueden usar para crear una tabla en DDIC
  • Sin la capacidad de dividir los textos en tokens de búsqueda, el sistema no puede reconocer una permutación de palabras, que es un estándar en las aplicaciones de búsqueda modernas
  • Sin embargo, lo que se puede hacer es agregar la funcionalidad ofrecida por los Tipos de datos de texto a una columna específica mediante la creación de un índica de texto completo
  • De esta manera, se pueden habilitar las funciones de búsqueda de texto y análisis de texto para la mayoría de los tipos DDIC de tipo carácter (incluidos CHAR, STRING, DATS, etc.)
  • Cuando se crea un índice de texto completo (Full Text Index) para una columna de la tabla, el sistema crea una columna interna invisible (columna sombreada) del tipo TEXTO, que contiene los mismos datos pero en una presentación optimizada para las solicitudes de búsqueda. En este contexto, el texto se fragmenta en tokens y se genera un diccionario adicional. A continuación un ejemplo:

  • Podemos crear el índice de texto completo (Full Text Index) utilizando la sentencia SQL CREATE FULLTEXT INDEX
  • A partir de la versión 7.4 de Abap, es posible crear un índice de texto completo a través del DDIC utilizando parámetros comunes

6. El uso de la búsqueda de textos a través de SQL

  • Como sucede con la mayoría de las funciones en SAP HANA, podemos invocar la búsqueda de texto a través de SQL. Ejemplo de uso de CONTAINS para búsqueda difusa:

  • CONTAINS se puede usar en otras dos variantes: EXACT y LINGUISTIC
  • CONTAINS permite realizar búsquedas en varias columnas; ejemplo de búsqueda exacta de líneas aéreas cuyos nombres o direcciones web contienen "Airlines" o "Airways" o terminan con ".com"

SELECT * FROM scarr WHERE CONTAINS ((carrname,url), 'Airlines OR Airways OR *.com, EXACT)

7. La búsqueda difusa (Fuzzy search)

  • La podemos usar para búsqueda simple en una o varias columnas de una tabla o vista. La cláusula CONTAINS permite especificar varias columnas. Ejemplo de búsqueda en el horario de vuelo a 'Tokio', y fué necesario definir un índice de texto completo para el campo CITYFROM y otro para CITYTO utilizando DDIC:

SELECT * FROM spfli WHERE CONTAINS ((cityfrom,cityto), 'Tokio', fuzzy(0.8))

8. El uso de la búsqueda de textos en ABAP

  • Las ayudas de búsqueda (Search Help) son una excelente opción para utilizar la búsqueda de textos en SAP HANA. Para ello debemos crear la ayuda de búsqueda en el Diccionario de datos Abap
  • En las opciones avanzadas (Enhanced Options) de la ayuda de búsqueda, podemos seleccionar: si los valores se muestran directamente, si se ejecuta una búsqueda de texto completo en varias columnas y qué nivel de detalle se aplica
  • Después de la activación, podemos integrar la ayuda de búsqueda con un programa de prueba:

REPORT zr_valuehelp.

PARAMETERS: cust_id TYPE s_customer MATCHCODE OBJECT zf4_fuzzy.


 

 

 


Sobre el autor

Publicación académica de Sergio Diaz, en su ámbito de estudios para el Máster ABAP for HANA.

SAP SemiSenior

Sergio Diaz

Profesión: Ingeniero de Sistemas - Colombia - Legajo: BB75D

✒️Autor de: 14 Publicaciones Académicas

🎓Egresado del módulo:

Certificación Académica de Sergio Diaz

✒️+Comunidad Académica CVOSOFT

Continúe aprendiendo sobre el tema "La búsqueda de textos y el análisis de datos no estructurados" de la mano de nuestros alumnos.

SAP SemiSenior

Unidad 2: Lección 4 squeda de textos y el análisis de datos no estructurados 1. Introducción a la búsqueda de textos y análisis de datos no estructurados 1.1 Ayudas de búsqueda y búsqueda de textos Las ayudas de búsqueda representan un excelente escenario de uso para las búsquedas de texto en SAP HANA 1.2 Ayudas de búsqueda y búsqueda de textos en SAP HANA Nos permite desarrollar ayudas de búsqueda que funcionan de manera similar a las búsquedas modernas en internet Búsqueda tolerante a errores también conocida como Búsqueda difusa o Fuzzy search 1.3 Reconocimiento de patrones El reconocimiento de patrones en textos y...

Acceder a esta publicación

Creado y Compartido por: Alejandra Soto Guerrero

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Junior

squeda textos y datos no estructurados Análisis de datos no estructurados Mejorar escenarios de búsqueda Reconocimiento de patrones Ayudas de Búsqueda Búsquedas sin conocer detalle exacto de los que se está buscando. Incluye variaciones ortográficas Búsqueda tolerante a errores. Fuzzy search Reconocimiento de patrones Análisis de texto. P ej: búsqueda de cliente ya existente. (concepto idéntico) Patrones en SAP Hana Reconocer las relaciones e incluso las intenciones o emociones dentro de los textos Principios básicos: Usabilidad optimizada de la búsqueda Estilo libre Tolerante a errores Lingüística y sinónimos Sugerencias de valor...

Acceder a esta publicación

Creado y Compartido por: Danilo Cortes

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

BUSQUEDA DE TEXTOS Y ANALISIS DE DATOS NO ESTRUCTURADOS. *Ayudas de búsqueda / búsquedas de textos / reconocimientos de patrones Principios básicos de las búsquedas de texto: *Permite a los usuarios utilizar las interfaces de una forma optimizada.(características comunes a los motores de búsqueda de internet, incluye funciones con un significado especial para las aplicaciones empresariales). características: Búsquedas de estilo libre. Búsqueda tolerante a errores fuzzy search - se incluyen entradas similares en el conjunto de resultados.. Búsqueda lingúistica y de sinónimos Sugerencias de Valor Ranking de resultados Facetas de búsquedas...

Acceder a esta publicación

Creado y Compartido por: Susana Mora

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

squeda de textos y Análisis de datos no estructurados Ayudas de búsqueda y la búsqueda de textos en SAP HANA que funcionan de manera similar a las búsquedas modernas en internet. Principios básicos de búsqueda de textos en SAP HANA proporciona una usabilidad optimizada de las interfaces de búsqueda. Algunas características son: Búsqueda de estilo libre donde el usuario no necesita saber la columna exacta en la BD se puede incluir todos los datos de una dirección como calle, código postal, ciudad, etc. Búsqueda tolerante a errores (búsqueda difusa o fuzzy search) donde el usuario puede variar de ortografía en su solicitud de búsqueda...

Acceder a esta publicación

Creado y Compartido por: Diego Fernando Delgado Ortiz / Disponibilidad Laboral: PartTime + Carta Presentación

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

SAP HANA ofrece unas funciones para analizar datos ABAP: - obtener mas información al reconocer patrones en los conjuntos de datos existentes - busca y analiza textos, mas formas de utilizar esta función en aplicaciones empresariales y hasta ahora no se utilizaban. Ayudas de squeda y búsqueda de textos en SAP HANA, permite desarrollar ayudas similar a las búsquedas de internet: 1. Búsqueda difusa o Fuzzy search de tolerancia a errores y procesar términos y sinónimos multilingües. 2. Reconocimiento de patrones: comprobar entradas idénticas. Objetivos de la búsqueda en SAP HANA es proporcionar a los usuarios uso optimizado del las interfases de búsqueda. Características...

Acceder a esta publicación

Creado y Compartido por: Maria Sanchez

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Junior

1.2 Las ayudas de squeda y la búsqueda de textos en SAP HANA Tiene una búsqueda difusa o Fuzzy Search. 1.3 Reconocimiento de patrones en SAP HANA Permite realizar búsquedas dentro de los textos, sino también extraer información adicional de los textos. 2. PRINCIPIOS BASICOS DE LA BUSQUEDA DE TEXTOS EN SAP HANA * Búsqueda de estilo libre * Búsqueda tolerante a errores (búsqueda difusa o fuzzy search) se puede variar la ortografia ligeramente en sus solicitudes de búsqueda. * Búsqueda linguistica y búsqueda de sinónimos. * Sugerencias de valor * Ranking de resultados se muestran los resultados con la tasa de probabilidad más alta se presenten...

Acceder a esta publicación

Creado y Compartido por: Maria Xiomara Rodriguez Panqueva / Disponibilidad Laboral: FullTime

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Expert


INTRODUCCIÓN A LA SQUEDA DE TEXTOS Y ANÁLISIS DE DATOS NO ESTRUCTURADOS Características de búsqueda de textos en SAP HANA Búsqueda de texto libre Búsqueda tolerante a errores (búsqueda difusa o fuzzy search): implica la búsqueda de caenas de caracteres. Búsqueda lingüistica y búsqueda de sinónimos. Podemos almacenar una lista de términos equivalentes. Sugerencias de valor (identificacion de búsquedas probables) Ranking de resultados Facetas de búsqueda Análisis de texto Tipos de datos de texto e índices...

Acceder a esta publicación

Creado y Compartido por: Juan Ignacio De Tejada Santiago / Disponibilidad Laboral: FullTime

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

---- Audio 1 Podemos obtener documentación completa acerca de la sentencia de Creación de los FULLTEXT INDEX en help.sap.com/hana. Debemos tener en cuenta que el nombre del índice de texto completo (FULLTEXT INDEX) debe ser único dentro de un esquema por lo que tiene sentido prefijar el nombre del índice con el nombre de la tabla base de datos para evitar posibles conflictos de nombres. ---- Audio 2 Tal como mencionamos podemos utilizar SQL para squeda de textos en SAP HANA, sin embargo actualmente hay un par de limitaciones con respecto a las combinaciones que son compatibles, una de ellas es que solo podemos utilizar la clausula CONTAINS para la búsqueda de textos en tablas que sean columnares....

Acceder a esta publicación

Creado y Compartido por: Vanessa Yadira Mendoza Zelaya

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP SemiSenior

squeda de textos y análisis de datos no estructurados. SAP HANA nos ofrece una función para analizar datos no estructurados. Si aprovechamos esta capacidad, podemos mejorar considerablemente la facilidad de uso de los escenarios de búsqueda dentro de los programas ABAP. Podemos obtener más información al reconocer los patrones en los conjuntos de datos existentes. 1- Las ayudas de búsqueda y la búsqueda de textos Las ayudas de búsqueda son un excelente escenario para las búsquedas de texto en SAP HANA. Los usuarios en ocasiones buscan un conjunto de datos muy grande sin saber los detalles de entrada o sin tener estos datos a la mano al momento de usar una ayuda de búsqueda....

Acceder a esta publicación

Creado y Compartido por: Jes?s Heriberto Qui?onez L?pez / Disponibilidad Laboral: FullTime + Carta Presentación

*** CVOSOFT - Nuestros Alumnos - Nuestro Mayor Orgullo como Academia ***

SAP Senior

1. Las ayudas de squeda y la búsqueda de textos en SAP HANA La función de búsqueda de texto de SAP HANA nos permite desarrollar ayudas de búsqueda que proporcionan una cierta tolerancia a errores y pueden procesar términos y sinónimos multilingües. Por ejemplo, podemos ingresar "buenes eires tele" en una ayuda de búsqueda y se interpretara correctamente a pesar de la ortografía incorrecta. Sin embargo, los usuarios no siempre pueden determinar fácilmente si el resultado devuelto es el esperado en este tipo de búsqueda tolerante a errores (Fuzzy search). La función de análisis de texto en SAP HANA no solo nos permite realizar búsquedas...

Acceder a esta publicación

Creado y Compartido por: Ricardo Daniel Tovar Barrera

 


 

👌Genial!, estos fueron los últimos artículos sobre más de 80.000 publicaciones académicas abiertas, libres y gratuitas compartidas con la comunidad, para acceder a ellas le dejamos el enlace a CVOPEN ACADEMY.

Buscador de Publicaciones:

 


 

No sea Juan... Solo podrá llegar alto si realiza su formación con los mejores!