Rastrear el contenido del sitio de HCL Commerce

Puede rastrear el contenido del sitio de HCL Commerce en las tiendas de inicio utilizando la API REST.

Antes de empezar

Asegúrese de que el servidor de búsqueda se ha iniciado y que ha completado las siguientes tareas.
  • HCL Commerce DeveloperCree el índice de búsqueda de HCL Commerce.
  • Importante: Asegúrese de configurar los archivos de configuración del rastreador de contenido de sitios para el sitio:
    • droidConfig.xml
    • filters.txt
    Para obtener más información, consulte Configuración del rastreador de contenido del sitio.
    Nota: Si ha rastreado el contenido en una topología agrupada, el rastreador debe ejecutarse desde un entorno de transición. Es decir, el rastreo no se debe realizar en un entorno de producción. Si debe rastrearse el contenido de producción, configure el rastreador para que visite el sitio de producción en vez de ejecutarlo directamente desde el entorno de producción. Este método simplifica la configuración al restringir el rastreador para que se ejecute en un entorno de transición de HCL Commerce y que actualice el índice en el repetidor.

Procedimiento

  1. Puede ejecutar el programa de utilidad desde la siguiente URL en el servidor de HCL Commerce Search:
    http://searchHost:port/search/admin/resources/crawler?action=start&langId=langId&storeId=storeId&catalogId=catalogId
    Donde el método es GET y la autenticación es spiuser. Acción es la acción que el rastreador debe realizar. Los posibles valores son:
    iniciar
    Inicia el rastreador.
    Parámetros necesarios:
    langId
    El identificador de idioma que desea utilizar en crear un índice no estructurado. Por ejemplo, langId=-1.
    storeId
    El ID de tienda que desea utilizar al crear un índice no estructurado. Por ejemplo, storeId=10501.
    catalogId
    El identificador de catálogo que desea utilizar al crear un índice no estructurado. Por ejemplo, catalogId=10001.
    estado
    Muestra el estado del rastreador.
    detener
    Detiene el rastreador.
  2. Asegúrese de que el programa de utilidad se ejecuta correctamente.
    Ejecutar el programa de utilidad con todos los parámetros implica lo siguiente:
    • Rastrear y descargar las páginas rastreadas en formato HTML en el directorio de destino.
    • Actualizar la base de datos con el archivo manifest.txt creado.
    • Invocar el indexador.
    Cada uno de los mensajes de estado de estas tareas se notifica por separado.
    En función de los parámetros transferidos puede comprobar si el programa de utilidad se ejecuta satisfactoriamente realizando las acciones siguientes:
    1. Verificar que las páginas rastreadas se descargan en el directorio de destino, searchServerPath\search\index\crawler\cache\date\number, donde date es la fecha en que se ejecutó el programa de utilidad y number es el número de ejecuciones de dicha fecha, empezando por 1.
    2. Verificar que la tabla SRCHCONFEXT con indexsubtype='WebContent' se ha actualizado con la ubicación manifest.txt correcta.
    3. Si se establece el índice automático en true: Verificar que las páginas rastreadas también se indexan.

Qué hacer a continuación

Después de rastrear el contenido de sitio de HCL Commerce, puede verificar los cambios en el escaparate.