Conector de reindexación completo

En este tema se describe el flujo de datos del conector NiFi predeterminado utilizado para la reindexación completa del índice de búsqueda Elasticsearch.

HCL Commerce Version 9.1.10.0 or later

Flujo de datos del conector de reindexación completo

El conector de reindexación vuelve a crear el Elasticsearch de búsqueda. Este índice consta de los índices Tienda, Catálogo, Categoría, Atributo, Producto, URL y Precio. El proceso de indexación se inicia con la creación de un esquema, la base de datos del producto y STA. Los datos se cargan desglosando progresivamente en el catálogo y luego en la categoría. Luego, el ciclo de flujo principal asume el mando, procesando los atributos de los productos en las URL de SEO y finalmente emergiendo de ese ciclo, hasta el precio.

El diagrama siguiente ilustra este flujo de datos a partir de la versión 9.1.10 de HCL Commerce. El flujo consta de cuatro etapas principales, cada una de las cuales contiene subetapas que pueden repetirse. Todas las etapas se describen en mayor detalle en Tabla 1.

La fase de proceso en segundo plano mejora la relevancia de la búsqueda de cada uno de los documentos del producto. No afecta al escaparate. Una vez que el índice de búsqueda pasa a estar en funcionamiento, la tienda pasa a estar operativa.
Note: El proceso de lenguaje natural (NLP) y las relaciones de coincidencia como la coincidencia de colores no se basan en que el índice que se está finalizando sea utilizable. Se construyen por separado y en paralelo con el índice y complementan su contenido cuando se completan.
Table 1. Tabla 1

Conector de reindexación completo

Etapas de flujo de datos de canalizaciones y nombres de conducto/flujo

BUCLE DE IDIOMA
ESQUEMA STA TIENDA CATÁLOGO CATEGORÍA ATRIBUTO PRODUCTO URL DE SEO PRECIO SEGUNDO PLANO
Tienda 1

StoreSchema2

Zookeeper

DatabaseSTAZookeeperStage1

Tienda

DatabaseStoreStage1

1a (documento principal)

DatabaseCatalogStage1a

1a (documento principal)

DatabaseCategoryStage1a

1a (documento principal)

DatabaseAttributeStage1a

1a (documento principal)

DatabaseProductStage1a

1a (URL de categoría)

DatabaseURLStage1a

1a (buscar precios de productos)

DatabasePriceStage1a

Etapa de categoría 1c (descripciones largas)

DatabaseCategoryStage1c

Catálogo

CatalogSchema

Palabra vacía sinónimo

LoadSTASynonymsStopwordStage1

1b (buscar filtros)

DatabaseCatalogStage1b

1b (buscar facetas)

DatabaseCategoryStage1b

1b (buscar valores de atributo)

DatabaseAttributeStage1b

1b (documento enriquecido)

DatabaseProductStage1b

1b (URL de producto)

DatabaseURLStage1b

1b (buscar precios de paquete compuesto)

DatabasePriceStage1b

Etapa del producto 1g (descripciones largas)

DatabaseProductStage1g

Atributo

AttributeSchema

1d (jerarquía de compilación)

DatabaseCategoryStage1d

1h (buscar elementos secundarios)

DatabaseProductStage1h

1c (tipo de página)

DatabaseURLStage1c

2 (copiar en producto)

CopyLink

Enriquecer NLP

NLPStage1

URL

URLSchema

1e (buscar facetas ocultas)

DatabaseCategoryStage1e

1i (buscar categoría principal)

DatabaseProductStage1i

1d (reserva de URL categoría)

DatabaseURLStage1d

SplitLink – Inventario

(Inicia Inventory Connector separado:)

Categoría

CategorySchema

1e (buscar atribuciones)

DatabaseProductStage1e

1e (reserva de URL del producto)

DatabaseURLStage1e

Etapa de inventario 1a (inventarios principales)

DatabaseInventoryStage1a

Producto

ProductSchema

1f (URL de contenido)

DatabaseURLStage1f

Etapa de inventario 1b (inventarios secundarios)

DatabaseInventoryStage1b

Descripción

DescriptionSchema

Etapa de inventario 2 (copiar en producto)

InventoryStage2

Precio

PriceSchema

Inventario

InventorySchema

Área de trabajo

WorkspaceSchema

1 Etiqueta de grupo de procesos

2 Nombre de conducto / Nombre de flujo (utilice nombres de flujo en NiFi para buscar grupos de procesos específicos en una etapa determinada)

Este conector utiliza los esquemas siguientes.

HCL Commerce Version 9.1.12.0 or later

Reindexación de eSites frente a la reindexación de tiendas con elementos de catálogo

Tal y como se describe en Elección del modelo de índice, la versión 9.1.12 de HCL Commerce Search introduce una alternativa al modelo de indexación de eSites preexistente. En dicho modelo, la reindexación para tiendas eSite utiliza el flujo de proceso que se describe en Flujo de datos del conector de reindexación completo. Centrándose en los flujos principales y laterales, los procesos se realizan en la siguiente secuencia:

Cada flujo de proceso solo puede alojar una tienda y un idioma compatible a la vez. Un componente de control de flujo se utiliza para realizar flujos de datos internos recurrentes con el fin de gestionar idiomas compatibles adicionales. Las URL de SEO y otros metadatos relacionados se indexan en un índice de URL independiente para la búsqueda de tiempo de consulta.

Por el contrario, el enfoque de indexación de la tienda con elementos de catálogo (CAS) procesa todos los sitios ampliados subyacentes y los idiomas compatibles en un único flujo de datos. Las etapas del proceso son muy similares a la del modelo eSite, excepto por el hecho de que la etapa de URL se sustituye por una etapa de página que solo indexa plantillas SEO asociadas con cada palabra clave. Las URL de SEO y los metadatos ya no se indexan, y, en su lugar, se calculan y almacenan en la memoria caché durante la consulta. El flujo de proceso resultante se muestra en el siguiente diagrama.:

Para obtener más información sobre el flujo de indexación en el modelo de indexación CAS, consulte Características de los índices de las tiendas con elementos de catálogo.