Rastrear el contenido del sitio de HCL Commerce
Puede rastrear el contenido del sitio de HCL Commerce en las tiendas de inicio utilizando la API REST.
Antes de empezar
Cree el índice de búsqueda de HCL Commerce.
- Importante: Asegúrese de configurar los archivos de configuración del rastreador de contenido de sitios para el sitio:
- droidConfig.xml
- filters.txt
Nota: Si ha rastreado el contenido en una topología agrupada, el rastreador debe ejecutarse desde un entorno de transición. Es decir, el rastreo no se debe realizar en un entorno de producción. Si debe rastrearse el contenido de producción, configure el rastreador para que visite el sitio de producción en vez de ejecutarlo directamente desde el entorno de producción. Este método simplifica la configuración al restringir el rastreador para que se ejecute en un entorno de transición de HCL Commerce y que actualice el índice en el repetidor.
Procedimiento
-
Puede ejecutar el programa de utilidad desde la siguiente URL en el servidor de HCL Commerce Search:
http://searchHost:port/search/admin/resources/crawler?action=start&langId=langId&storeId=storeId&catalogId=catalogId
Donde el método es GET y la autenticación es spiuser. Acción es la acción que el rastreador debe realizar. Los posibles valores son:- iniciar
- Inicia el rastreador. Parámetros necesarios:
- langId
- El identificador de idioma que desea utilizar en crear un índice no estructurado. Por ejemplo, langId=
-1
. - storeId
- El ID de tienda que desea utilizar al crear un índice no estructurado. Por ejemplo, storeId=
10501
. - catalogId
- El identificador de catálogo que desea utilizar al crear un índice no estructurado. Por ejemplo, catalogId=
10001
.
- estado
- Muestra el estado del rastreador.
- detener
- Detiene el rastreador.
-
Asegúrese de que el programa de utilidad se ejecuta correctamente.
Ejecutar el programa de utilidad con todos los parámetros implica lo siguiente:
- Rastrear y descargar las páginas rastreadas en formato HTML en el directorio de destino.
- Actualizar la base de datos con el archivo manifest.txt creado.
- Invocar el indexador.
En función de los parámetros transferidos puede comprobar si el programa de utilidad se ejecuta satisfactoriamente realizando las acciones siguientes:- Verificar que las páginas rastreadas se descargan en el directorio de destino, searchServerPath\search\index\crawler\cache\date\number, donde date es la fecha en que se ejecutó el programa de utilidad y number es el número de ejecuciones de dicha fecha, empezando por 1.
- Verificar que la tabla SRCHCONFEXT con
indexsubtype='WebContent'
se ha actualizado con la ubicación manifest.txt correcta. - Si se establece el índice automático en true: Verificar que las páginas rastreadas también se indexan.