Visión general del Programa de utilidad de extracción de datos

El Programa de utilidad de extracción de datos es un programa de utilidad de línea de mandatos que puede utilizar para extraer datos de la base de datos de HCL Commerce a un archivo de salida.

Puede ejecutar el programa de utilidad en los entornos de transición y producción, aunque se recomienda ejecutarlo en un entorno que tenga la información necesaria para realizar la extracción. Por ejemplo, el entorno de transición puede que no tenga la información de inventario o precios para una entrada de catálogo. En este caso, ejecute el programa de utilidad en el entorno de producción.

Este programa de utilidad utiliza la infraestructura del Programa de utilidad de carga de datos y sigue un proceso de interacción similar:
  1. El lector de datos configurados para el programa de utilidad lee los datos que deben extraerse de la base de datos y los devuelve al creador de objetos de negocio.
  2. El creador de objetos de negocio rellena un objeto de negocio basado en los datos que se pasan del lector de datos. El creador de objetos de negocio pasa el objeto al mediador de objetos de negocio.
  3. El mediador de objetos de negocio transforma el objeto de negocio en una lista de objetos de correlación que después de pasa al grabador de datos.
  4. El grabador de datos generará el archivo de salida configurada y grabará la lista de objetos CSV o XML en el archivo de salida.
Existen dos métodos para extraer datos que puede utilizar con el Programa de utilidad de extracción de datos, una extracción basada en SQL y una extracción basada en la lógica de negocio. El método de extracción que debe configurar para que el programa de utilidad lo utilice dependerá del tipo de datos que desee extraer.
  • Si desea extraer objetos de promociones, marketing o Commerce Composer, debe utilizar la extracción basada en SQL.
  • Si desea extraer datos de catálogo para generar datos de Enterprise Product Report (EPR) para utilizarlos con IBM Product Recommendations, debe utilizar la extracción basada en la lógica.

Extracción basada en SQL

Esta extracción basada en SQL utiliza una conexión de base de datos directa y sentencias SQL para extraer datos. Salvo que esté extrayendo datos para utilizarlos con IBM Product Recommendations o extrayendo datos que no puedan recuperarse directamente de la base de datos, se recomienda utilizar este enfoque basado en SQL. Este proceso de extracción basado en SQL mejora el rendimiento y la flexibilidad del programa de utilidad en comparación con el método de extracción basado en la lógica de negocio.

El proceso basado en SQL también puede reducir el coste de implementación para personalizar el programa de utilidad para extraer datos que no están soportados para la extracción con el programa de utilidad de forma predeterminada. De forma predeterminada, el programa de utilidad da soporte a la extracción de los siguientes tipos de datos con el proceso de extracción basado en SQL:
  • Promociones
  • Objetos de Commerce Composer, tales como widgets, diseños, plantillas de diseño y páginas
  • Objetos de marketing, tales como actividades, zonas de e-Marketing, contenido, campañas, adjuntos y segmentos de clientes
Para configurar el programa de utilidad para utilizar un proceso de extracción basado en SQL en lugar del proceso de lógica de negocio, configure el programa de utilidad para utilizar las siguientes clases:
UniqueIdReader
Esta clase de lector de datos añade soporte para que el programa de utilidad utilice sentencias SQL para recuperar el valor de ID exclusivo para un objeto de negocio. La clase de lector de datos podrá enviar un objeto de correlación para el objeto de negocio al creador de objetos de negocio.
AssociatedObjectMediator
El mediador de objetos empresariales añade soporte para que el programa de utilidad SQL utilice sentencias SQL para recuperar la información detallada de objetos de negocio para el objeto de correlación. El mediador podrá enviar un objeto de correlación actualizado que contenga la información detallada de objetos de negocio a la clase de grabador de datos configurados.
CSVWriter
Una clase de grabador de datos que puede convertir los objetos de correlación enviados por el mediador de objetos de negocio en un registro con formato CSV. Esta clase de grabador podrá grabar el registro en el archivo CSV de salida configurado. Utilice esta clase de grabador de datos o la clase de grabador de datos XmlWriter.
XmlWriter
Una clase de grabador de datos que puede convertir los objetos de correlación enviados por el mediador de objetos de negocio en un elemento con formato XML. Esta clase de grabador podrá grabar el elemento y todos los subelementos en el archivo XML de salida configurado. Utilice esta clase de grabador de datos o la clase de grabador de datos CSVWriter.
ValueHandler
Esta interfaz proporciona un punto de personalización que puede utilizar cuando el programa de utilidad no puede recuperar datos directamente de la base de datos. También puede utilizar esta clase cuando necesite modificar datos antes de que la clase de grabador de datos grabe los datos en el archivo de salida.
Para obtener más información sobre la configuración de Programa de utilidad de extracción de datos para utilizar estas clases y el proceso de extracción basado en SQL, consulte Configuración y ejecución del programa de utilidad de extracción de datos. Cuando configure el programa de utilidad, se recomienda copiar y editar los archivos de configuración de ejemplo proporcionados para ayudarle a configurar y ejecutar rápidamente el programa de utilidad.

Extracción basada en la lógica de negocio

Este enfoque utiliza la lógica de negocio para captar los datos, parecido al comportamiento del servicio web existente. La clase de lector de datos configurado para el programa de utilidad utiliza el servicio web de catálogo para recuperar datos en el formato de objeto de negocio de catálogo (nombre). La clase de creador de objetos de negocio no rellena ningún dato en este proceso. En su lugar, la clase de creador pasa los objetos de nombre de la clase de grabador de datos a la clase de mediador de objetos de negocio. La clase de mediador luego se utilizará para extraer los datos del objeto de negocio para crear un objeto de correlación. El grabador de datos a continuación convertirá el objeto de correlación en archivos de salida con formato CSV, como por ejemplo archivos EPCMF y ECDF para utilizarlos con .

Este método de lógica de negocio es útil cuando los datos no pueden recuperarse directamente de la base de datos. Por ejemplo, cuando es necesaria la lógica de negocio complicada para calcular los datos, como por ejemplo para la extracción de datos de precios que utiliza reglas de precios. Para extraer estos datos de precios, es necesario la lógica para aplicar las reglas de precios antes para poder determinar, extraer y grabar precios de entrada de catálogo en un archivo de salida. Cuando es necesaria la lógica de negocio complicada, no es necesario volver a implementar la lógica que se utiliza para cargar o crear los datos para dar soporte a la extracción de datos.

Sin embargo, este enfoque tiene algunas desventajas:
  • El enfoque puede provocar que el rendimiento del proceso de extracción puede sea lento. Los servicios basados la lógica para recuperar datos están pensados para recuperar un solo objeto de negocio o una lista de objetos de negocio. Sin embargo, si alguno de los objetos de negocio son grandes, el rendimiento puede ser lento.
  • La personalización del proceso de extracción requiere un esfuerzo significativo para recuperar datos personalizados o datos que no están soportados para la extracción de forma predeterminada. Si es necesario extraer datos personalizados y datos que no están soportados para su extracción con el programa de utilidad, debe implementar sus propios servicios personalizados para extraer los datos.

Archivos de configuración para el Programa de utilidad de extracción de datos

El Programa de utilidad de extracción de datos utiliza tres tipos de archivos de configuración. Se proporcionan ejemplos de cada tipo de archivo, pero debe actualizar los archivos de ejemplo con información de configuración específica para su entorno. Estos archivos de configuración se basan en los archivos de configuración del Programa de utilidad de carga de datos , pero incluyen algunas extensiones.
wc-dataextract.xml
Este archivo es el archivo de configuración de orden al que debe apuntar al ejecutar el Programa de utilidad de extracción de datos. Este archivo especifica las vías de acceso al archivo de configuración de entorno y al archivo de configuración de objeto de negocio.
wc-dataextract-env.xml
El archivo de configuración de entorno, que incluye las variables de entorno para la instancia de HCL Commerce. Estas variables incluyen la siguiente información:
  • Las variables de contexto de negocio, incluidos el identificador de tienda, el identificador de catálogo y el idioma y la moneda predeterminados para la tienda.
  • Los valores de entorno de base de datos, incluido el tipo, el nombre y el esquema de base de datos.
wc-dataextract-business_object.xml
El archivo de configuración de objetos de negocio, que configura cómo identifica el programa de utilidad los datos que deben extraerse para un objeto de negocio específico. De forma predeterminada, se proporcionan archivos de configuración de objetos de negocio de ejemplo para la extracción de datos para los siguientes tipos de objetos con el proceso de extracción basado en SQL:
  • Objetos de Commerce Composer

    Los archivos de configuración de ejemplo para la extracción de widgets, diseños, plantillas y páginas de Commerce Composer. Los archivos se configuran para generar archivos CSV que pueden utilizarse con el Programa de utilidad de carga de datos .

  • Promociones

    Los archivos de configuración de ejemplo para la extracción de datos de promoción se configuran para generar un archivo XML que se puede utilizar con el Programa de utilidad de carga de datos .

  • Objetos de marketing

    Los archivos de configuración de ejemplo se proporcionan para extraer actividades de marketing, campañas, contenido, adjuntos, segmentos de clientes y zonas de e-Marketing. Los archivos se configuran para generar archivos CSV que pueden utilizarse con el Programa de utilidad de carga de datos .

Estos archivos incluyen la siguiente información:
  • La información de contexto de negocio.
  • Las correlaciones de datos que son necesarias para transformar objetos de negocio de HCL Commerce en datos que puedan grabarse en el archivo de salida.
  • Las definiciones para el pedido en que el programa de utilidad graba los datos en las columnas en el archivo.
  • Los punteros a las interfaces y clases de implementación que el programa de utilidad utiliza para extraer y transformar los datos.
Nota: Los archivos de configuración de ejemplo también se proporcionan para extraer datos de entrada de catálogo en un archivo EPCMF y datos de categoría en un archivo ECDF para utilizarlos con IBM Product Recommendations. Estos archivos de configuración de ejemplo configuran el programa de utilidad para utilizar el método de extracción basado en la lógica de negocio. Para obtener más información sobre la configuración del programa de utilidad para utilizar los archivos de ejemplo, consulte Programa de utilidad de extracción de datos para recomendaciones dinámicas en.

Procedimientos recomendados

Cuando se utiliza el Programa de utilidad de extracción de datos, es recomendable seguir unas pautas de configuración generales para garantizar que utiliza todas las capacidades del programa de utilidad. Para obtener más información, consulte Programa de utilidad de extracción de datos métodos recomendados.