PROMO JULIO en CVOSOFT United States Of America: 💎Calidad, 🔥Bonificaciones, 🥶Precios Congelados y MÁS!

 X 

✒️ABAP HANA La búsqueda de textos y el análisis de datos no estructurados

ABAP HANA La búsqueda de textos y el análisis de datos no estructurados

ABAP HANA La búsqueda de textos y el análisis de datos no estructurados

Unidad 2: Lección 4 Búsqueda de textos y el análisis de datos no estructurados

1. Introducción a la búsqueda de textos y análisis de datos no estructurados

1.1 Ayudas de búsqueda y búsqueda de textos

Las ayudas de búsqueda representan un excelente escenario de uso para las búsquedas de texto en SAP HANA

1.2 Ayudas de búsqueda y búsqueda de textos en SAP HANA

Nos permite desarrollar ayudas de búsqueda que funcionan de manera similar a las búsquedas modernas en internet

Búsqueda tolerante a errores también conocida como Búsqueda difusa o Fuzzy search

1.3 Reconocimiento de patrones

El reconocimiento de patrones en textos y documentos representa un tipo completamente diferente de función de análisis de texto

2. Principios básicos de búsqueda de textos en SAP HANA

características:

  • Búsqueda de estilo libre
  • Búsqueda tolerante a errores (búsqueda difusa o fuzzy search)
  • Búsqueda lingüística y búsqueda de sinónimos
  • Sugerencias de valor
  • Ranking de resultados
  • Facetas de búsqueda
  • Análisis de texto (particularmente análisis de sentimiento)

3. Tipos de datos de texto y los índices de txto completo en SAP HANA

La búsqueda difusa en SAP HANA se basa en los tipos de datos del almacén de columnas

TEXT (representa un objeto grande)y SHORTTEXT (cadenas de caracteres de una longitud determinada)

Índice de texto completo (full text index)

el sistema crea una columna interna invisible del tipo TEXTO que contiene los mismos datos pero en una presentación optimizada para las solicitudes de búsqueda, el texto se fragmenta en tokens y se genera un diccionario adicional

Para crear el índice de texto completo Full text index se usa la sentencia SQL CREATE FULLTEXT INDEX

4. Uso de la búsqueda de textos a través de SQL

Palabra clave CONTAINS

Permite llamar a las múltiples variantes de la búsqueda de texto

Parámetro FUZZY, define el valor de umbral, donde un valor entre 0.7 y 0.8 suele ser un buen valor estándar para obtener resultados que son relativamente similares a la solicitud de búsqueda

En las búsquedas con la adición EXACT, el sistema busca coincidencias exactas para la búsqueda con palabras completas


 

 

 


Sobre el autor

Publicación académica de Alejandra Soto Guerrero, en su ámbito de estudios para el Máster ABAP for HANA.

SAP SemiSenior

Alejandra Soto Guerrero

Profesión: Ingeniería en Sist. Computacionales - Colombia - Legajo: XX98U

✒️Autor de: 16 Publicaciones Académicas

🎓Egresado del módulo:

Certificación Académica de Alejandra Soto