✒️ABAP HANA La búsqueda de textos y el análisis de datos no estructurados
ABAP HANA La búsqueda de textos y el análisis de datos no estructurados
INTRODUCCIÓN A LA BÚSQUEDA DE TEXTOS Y ANÁLISIS DE DATOS NO ESTRUCTURADOS
Características de búsqueda de textos en SAP HANA
-
Búsqueda de texto libre
-
Búsqueda tolerante a errores (búsqueda difusa o fuzzy search): implica la búsqueda de caenas de caracteres.
-
Búsqueda lingüistica y búsqueda de sinónimos. Podemos almacenar una lista de términos equivalentes.
-
Sugerencias de valor (identificacion de búsquedas probables)
-
Ranking de resultados
-
Facetas de búsqueda
-
Análisis de texto
Tipos de datos de texto e índices de texto completo en SAP HANA
En ello se basa la busqueda difusa: TEXT (objetos grandes) y SHORTTEXT (cadenas de longitud determinada)
El Full Text Index, para una columna de una tabla, crea una columna invisible, con os mismos datos pero optimizados para las sokicitudes de búsqueda.
Tambien podemos crearun Full Text Index utilizando la sentencia SQL, SQL CREATE FULLTEXT INDEX:
CREATE FULLTEX INDEX <nombre de indice>
ON <nombre de tabla> ( <nombre de columna> )
[<lista de parametros>]
Ejemplo: CREATE FULLTEXT INDEX scarr~name ON scarr(carrname)
Estos indices no se transportan automáticamente.
BUSQUEDA DE TEXTOS A TRAVES DE SQL
-
CONTAINS:
SELECT <lista de campos>
FROM <tabla o vista>
WHERE CONTAINS (<columnas>, <requerimiento de búsqueda>, <parametros>);
-
FUZZY: parametro que define el umbral (0.7 y 0.8 son un buen valor)
-
Busqueda Exacta /Búsqueda Lingüistica: Ademas de FUZZY, podemos utilizar CONTAINS con otras variantes: EXACT (busca coincidencias exactas) y LINGUISTIC.
Busqueda difusa (Fuzzy Search)
en este caso es necesario definir un indice de texto completo para CITYFROM y otro para CITYTO, utilizando el DDIC. Este ejemplo no dará los resultaos de los vuelos que salen y llegan a TOKIO, a pesar de desviarnos algo en la ortografía.
USO EN ABAP DE LA BUSQUEDA DE TEXTOS
-
Crear la ayuda de búsqueda en el Diccionario de Datos ABAP, utilizando la transacción SE80 o SE11.
-
Seleccionar opciones en Enhanced options
 
 
 
Sobre el autor
Publicación académica de Juan Ignacio De Tejada Santiago, en su ámbito de estudios para el Máster ABAP for HANA.
Juan Ignacio De Tejada Santiago
Profesión: Informatico - Espa?a - Legajo: NW89P
✒️Autor de: 219 Publicaciones Académicas
🎓Egresado de los módulos:
- Máster ABAP for HANA
- Máster Funcional ABAP
- Máster ABAP Orientado a Objetos
- Carrera Consultor ABAP Nivel Avanzado
- Carrera Consultor ABAP Nivel Inicial
Disponibilidad Laboral: FullTime
Certificación Académica de Juan De