Limitación de términos y caracteres de búsqueda de la consulta de búsqueda

Puede limitar los términos y caracteres de búsqueda la consulta de búsqueda, como palabras no importantes, lematización o inhabilitación de comodines y otros caracteres.

Procedimiento

  • Eliminación de palabras no importantes de la consulta de búsqueda:
    Las palabras frecuentes eliminan categorías léxicas comunes que normalmente no son importantes. Como el/la/los/las, y o para. Se definen en el archivo stopwords.txt: Por ejemplo, si un comprador busca la camisa en el escaparate, Solr omite la.

    Para activar la característica de palabras frecuentes:

    1. Copie el archivo solrhome/MC_masterCatalogID/locale/CatalogEntry/conf/stopwords.txt en una ubicación que será accesible dentro del contenedor del servidor de búsqueda.
    2. Añada el valor stopwords=stopwords_file_path a la columna CONFIG de la tabla de base de datos SRCHCONFEXT, donde stopwords_file_path es la vía de acceso relativa al archivo de descubrimiento en el contenedor. El mandato para insertar los datos es update srchconfextset config='stopwords_en=stopwords_file_path' where srchconfext_id=x;, donde stopwords_en=stopwords_file_path es la ruta al archivo stopwords.txt y x debe sustituirse por el ID deseado. Normalmente, es el registro para el subtipo de índice "Structured" con un idioma determinado.
    3. Reinicie el servidor de búsqueda de HCL Commerce.

    Para crear una lista de palabras frecuentes específicas del idioma, añada el código de idioma al parámetro palabras frecuentes de la entrada de base de datos. Esta versión del valor utiliza el formato stopwords_lang=stopwords_lang_file_path, donde stopwords_lang_file_path es la vía de acceso al archivo de palabras frecuentes específicas del idioma.

    Por ejemplo, si desea añadir sus propia palabras frecuentes en francés, añada stopwords_fr= stopwords_fr_file_path a la columna CONFIG de la tabla SRCHCONFEXT.

    Las palabras frecuentes se tienen en cuenta en el tiempo de indexación y de consulta.

    Si está utilizando el tipo de búsqueda AND, no se devuelven resultados de búsqueda, porque el/la/los/las se ha definido en el archivo stopwords.txt. Para obtener más información, consulte StopFilterFactory.

  • Prevención de lematización:
    Si desea que determinadas palabras no se lematicen, puede añadirlas al archivo protwords.txt.
  • Inhabilitación de búsquedas con comodines y otros caracteres:
    La búsqueda con comodines está habilitada de forma predeterminada pero, si es necesario, puede inhabilitarla por razones de seguridad o de rendimiento en tiempo de ejecución.
    • El rendimiento puede verse afectado, porque una búsqueda con comodines que utiliza un término común puede devolver muchos documentos del índice de búsqueda.
    • La seguridad puede ser un tema a tener en cuenta, porque Solr no analiza y aplica filtros a las búsquedas con comodines.

    Una lista de palabras prohibidas impide a la solicitud de búsqueda realizar nuevas búsquedas, y se puede configurar en el archivo wc-component.xml.

    Por ejemplo, al buscar * de forma predeterminada, la página resultante se direcciona a la página Caracteres prohibidos de la tienda.

    La configuración predeterminada es:
    
    <_config:property name="StopPatterns" 
    value="\*,~,\?,&apos;&apos;,&quot;&quot;,.*\\.*,.*/.*,.*\|.*" /> 

    Puede actualizar la configuración para inhabilitar las búsquedas con comodines (*) u otros caracteres utilizando el formato de expresión regular.