✒️ABAP HANA La búsqueda de textos y el análisis de datos no estructurados
ABAP HANA La búsqueda de textos y el análisis de datos no estructurados
Unidad 2: Lección 4 Búsqueda de textos y el análisis de datos no estructurados
1. Introducción a la búsqueda de textos y análisis de datos no estructurados
1.1 Ayudas de búsqueda y búsqueda de textos
Las ayudas de búsqueda representan un excelente escenario de uso para las búsquedas de texto en SAP HANA
1.2 Ayudas de búsqueda y búsqueda de textos en SAP HANA
Nos permite desarrollar ayudas de búsqueda que funcionan de manera similar a las búsquedas modernas en internet
Búsqueda tolerante a errores también conocida como Búsqueda difusa o Fuzzy search
1.3 Reconocimiento de patrones
El reconocimiento de patrones en textos y documentos representa un tipo completamente diferente de función de análisis de texto
2. Principios básicos de búsqueda de textos en SAP HANA
características:
- Búsqueda de estilo libre
- Búsqueda tolerante a errores (búsqueda difusa o fuzzy search)
- Búsqueda lingüística y búsqueda de sinónimos
- Sugerencias de valor
- Ranking de resultados
- Facetas de búsqueda
- Análisis de texto (particularmente análisis de sentimiento)
3. Tipos de datos de texto y los índices de txto completo en SAP HANA
La búsqueda difusa en SAP HANA se basa en los tipos de datos del almacén de columnas
TEXT (representa un objeto grande)y SHORTTEXT (cadenas de caracteres de una longitud determinada)
Índice de texto completo (full text index)
el sistema crea una columna interna invisible del tipo TEXTO que contiene los mismos datos pero en una presentación optimizada para las solicitudes de búsqueda, el texto se fragmenta en tokens y se genera un diccionario adicional
Para crear el índice de texto completo Full text index se usa la sentencia SQL CREATE FULLTEXT INDEX
4. Uso de la búsqueda de textos a través de SQL
Palabra clave CONTAINS
Permite llamar a las múltiples variantes de la búsqueda de texto
Parámetro FUZZY, define el valor de umbral, donde un valor entre 0.7 y 0.8 suele ser un buen valor estándar para obtener resultados que son relativamente similares a la solicitud de búsqueda
En las búsquedas con la adición EXACT, el sistema busca coincidencias exactas para la búsqueda con palabras completas
 
 
 
Sobre el autor
Publicación académica de Alejandra Soto Guerrero, en su ámbito de estudios para el Máster ABAP for HANA.
Alejandra Soto Guerrero
Profesión: Ingenier?a en Sist. Computacionales - Colombia - Legajo: XX98U
✒️Autor de: 16 Publicaciones Académicas
🎓Egresado del módulo:
Certificación Académica de Alejandra Soto