Archivos de configuración de carga de índice para la indexación desde archivos CSV

Puede cargar información de índice de un archivo CSV. La carga de índice necesita los archivos de configuración antes de poder ejecutarse desde un navegador web.

Carga del índice desde un archivo CSV

Siga estos pasos para cargar información de índice de un archivo CSV.

  1. Edite el archivo de configuración wc-dataload-profile.xml y añada la ubicación del archivo CSV y el nombre de núcleo de destino.
  2. Especifique CSVReader como lector, y SolrIndexLoadMapObjectBuilder como creador de objetos de negocio en wc-businessObject-profile.xml.
Si está utilizando un archivo CSV para cargar datos de índice, la Carga de índice requiere tres archivos de configuración. Estos archivos se basan en las definiciones de esquemas XML de la infraestructura de Carga de datos:

Archivos de configuración de carga de índice

Archivo de configuración de carga de índice Archivo de definición de esquema
Archivo de configuración del entorno (wc-indexload-env.xml) wc-dataload-env.xsd
Archivo de configuración de perfil (wc-indexload-profileName.xml) wc-indexload.xsd
Archivo de configuración de elemento de perfil (wc-indexload-businessobject.xml) wc-indexload-item.xsd

Archivo de configuración del entorno (wc-indexload-env.xml)

El archivo wc-indexload-env.xml contiene información de control de entorno y las propiedades globales que se necesitan para la carga de índice, incluido un origen de datos y grabador de datos común que se utilizará para persistir los datos.

El archivo wc-indexload-env.xml no suelen requerir personalización. Puede utilizar el archivo de ejemplo predeterminado tal cual.

Archivo de configuración de perfil (wc-indexload-profileName.xml)

El archivo wc-indexload-profileName.xml contiene atributos de rendimiento configurables y una o varias definiciones de elementos de carga.

Los nombres de perfil que defina en los archivos de configuración se sustituyen a continuación como un parámetro de URL cuando se llama a la carga de índice en un navegador web.

Las configuraciones de elemento de carga se listan bajo la sección de orden de carga de este archivo. Se procesan en el mismo orden en el que se especifican.

Puede contener una o varias definiciones LoadItem, con cada configuración de LoadItem especificando la configuración de LoadItem específica y el destino de coreName. Varios LoadItems se ejecutan en paralelo, sin secuencia.

Ejemplo: wc-indexload-price.xml

<_config:LoadItem name="ExternalPrice-1" businessObjectConfigFile="wc-indexload-price-sql.xml">
			<_config:property name="coreName" value="MC_10001_CatalogEntry_Price_generic" />
			<_config:property name="groupName" value="1" />
	  </_config:LoadItem>

Se aplican los siguientes atributos de rendimiento configurables a los archivos de configuración de perfil:
batchSize
Umbral cuando los documentos se comprometen de forma flexible en la memoria.
El valor predeterminado es 1. Si se especifica un valor de 0, no compromete hasta que finaliza el elemento de carga.
commitCount
Umbral cuando los documentos se comprometen de forma fija en el disco de la memoria.
Puede utilizar un commitCount de 0 si utiliza un compromiso basado en memoria. Para obtener más información, consulte Ajuste de la carga de índice.
ThreadLaunchTimeDelay
Cantidad de tiempo en milisegundos que se debe esperar antes de iniciar otra hebra nueva para evitar sobrecargar el sistema en el arranque.
El valor predeterminado es 1000.
OptimizeAfterIndexing
Indica si la carga de índice realiza la optimización de índice después del compromiso.
Nota: Si se realiza la optimización tras una indexación completa, mejora el rendimiento en tiempo de ejecución; sin embargo, aumenta el tiempo de indexación general.
StatusRefreshInterval
Cantidad máxima de tiempo en segundos a esperar antes de renovar el estado de carga de índice actual y visualizarlo en el registro administrativo.
El valor predeterminado es 300. Utilice un valor de -1 para inhabilitar el servicio.
DocumentSizeSamplingInterval
rango de tiempo en segundos para calcular el tamaño del documento indexado. Utilice -1 para inhabilitar el servicio. El valor predeterminado es 300.
IndexHeightCacheHint
Un número que proporciona sugerencias al sistema para determinar el tamaño de la memorias caché aplicables a la altura de índice que se utiliza durante la indexación.
IndexWidthCacheHint
Un número que proporciona sugerencias al sistema para determinar el tamaño de las memorias caché aplicables para la anchura de índice que se utiliza durante la indexación.

Archivo de configuración de elemento de perfil (wc-indexload-external-price.xml)

<_config:LoadItem name="ExternalPrice-1" businessObjectConfigFile="wc-indexload-external-price.xml">
<_config:property name="coreName" value="MC_10001_CatalogEntry_Price_generic" />
<_config:DataSourceLocation location="C:\Patches\delta.csv" />
 </_config:LoadItem>
Donde
coreName
El nombre del nombre de núcleo de extensión.
DataSourceLocation
La ubicación del archivo de datos CSV.

Archivos de configuración de ejemplo

Descargue y extraiga el código de ejemplo siguiente: IndexLoadSampleCode.zip. El ejemplo incluye los archivos de configuración utilizados por la carga de índice y las actualizaciones manuales que se llevan a cabo en la tarea Indexación de precios de contrato utilizando la carga de índice, para referencia.