✒️ABAP HANA - La búsqueda de textos y el análisis de datos no estructurados

ABAP HANA La búsqueda de textos y el análisis de datos no estructurados

INTRODUCCIÓN A LA BÚSQUEDA DE TEXTOS Y ANÁLISIS DE DATOS NO ESTRUCTURADOS

Características de búsqueda de textos en SAP HANA

  • Búsqueda de texto libre

  • Búsqueda tolerante a errores (búsqueda difusa o fuzzy search): implica la búsqueda de caenas de caracteres.

  • Búsqueda lingüistica y búsqueda de sinónimos. Podemos almacenar una lista de términos equivalentes.

  • Sugerencias de valor (identificacion de búsquedas probables)

  • Ranking de resultados

  • Facetas de búsqueda

  • Análisis de texto

Tipos de datos de texto e índices de texto completo en SAP HANA

En ello se basa la busqueda difusa: TEXT (objetos grandes) y SHORTTEXT (cadenas de longitud determinada)

El Full Text Index, para una columna de una tabla, crea una columna invisible, con os mismos datos pero optimizados para las sokicitudes de búsqueda.

Tambien podemos crearun Full Text Index utilizando la sentencia SQL, SQL CREATE FULLTEXT INDEX:

CREATE FULLTEX INDEX <nombre de indice>

ON <nombre de tabla> ( <nombre de columna> )

[<lista de parametros>]

Ejemplo: CREATE FULLTEXT INDEX scarr~name ON scarr(carrname)

Estos indices no se transportan automáticamente.

BUSQUEDA DE TEXTOS A TRAVES DE SQL

  • CONTAINS:

SELECT <lista de campos>

FROM <tabla o vista>

WHERE CONTAINS (<columnas>, <requerimiento de búsqueda>, <parametros>);

  • FUZZY: parametro que define el umbral (0.7 y 0.8 son un buen valor)

  • Busqueda Exacta /Búsqueda Lingüistica: Ademas de FUZZY, podemos utilizar CONTAINS con otras variantes: EXACT (busca coincidencias exactas) y LINGUISTIC.

Busqueda difusa (Fuzzy Search)

en este caso es necesario definir un indice de texto completo para CITYFROM y otro para CITYTO, utilizando el DDIC. Este ejemplo no dará los resultaos de los vuelos que salen y llegan a TOKIO, a pesar de desviarnos algo en la ortografía.

USO EN ABAP DE LA BUSQUEDA DE TEXTOS

  • Crear la ayuda de búsqueda en el Diccionario de Datos ABAP, utilizando la transacción SE80 o SE11.

  • Seleccionar opciones en Enhanced options


Sobre el autor

Publicación académica de Juan Ignacio De Tejada Santiago, en su ámbito de estudios para el MASTER ABAP for HANA.

SAP Expert

Juan Ignacio De Tejada Santiago

Profesión: Informatico - España - Legajo: NW89P

✒️Autor de: 219 Publicaciones Académicas

🎓Egresado de los módulos:

Disponibilidad Laboral: FullTime

Certificación Académica de Juan De

 

:: Al igual que Juan ¿Usted está dispuesto a aprender ABAP?

El lunes 20 Septiembre 2021 comenzamos la 🎓Carrera Consultor ABAP.
Juntos para realizar sus más grandes desafíos!

 Cargando presentación, aguarde unos instantes...

 

 

+Recursos Gratuitos en CVOSOFT:

¡Lo importante es aprender!, por eso en CVOSOFT la comunidad SAP más grande de habla hispana, ponemos a su alcance los siguientes recursos abiertos libres y gratuitos:

Buscador de Publicaciones:

 

 

Consultas y Soporte

👋Hola! Estamos listos para ayudarle con el soporte que su carrera merece.

Acceda sección contacto y seleccione canal de comunicación más cómodo para usted.

🤝Aguardamos su mensaje, ¡Éxitos!

 


 

👉Que las empresas tomen en serio sus estudios es muy importante para que su inversión educativa tenga sentido.
Las empresas líderes de United States y del Mundo confían a CVOSOFT su recurso más valioso, la formación de su gente.

¿Quieres conocerlas?