Verificar los resultados de la carga de datos

Verifique que el programa de utilidad de carga de datos se ha ejecutado satisfactoriamente comprobando el valor de salida en el informe de resumen o en el archivo wc-dataload.log. Si se producen errores, analice los datos de los informes de error como el primer paso para encontrar la causa raíz.

Antes de empezar

Debe ejecutar el programa de utilidad de carga de datos antes de verificar los resultados.

Por qué y cuándo se efectúa esta tarea

El archivo de registro/rastreo wc-dataload.log se genera cada vez que se ejecuta el programa de utilidad de carga de datos. Además, se genera un archivo de registro de errores aparte para cada elemento de carga que consta de uno o más errores. Si no se produce ningún error no se genera ningún registro de errores. El informe de resumen es la información que aparece en la consola cuando ejecuta el programa de utilidad de carga de datos. Para obtener más información sobre el esquema del archivo de configuración del orden de carga de datos, consulte Archivo de configuración de orden de carga de datos.

Procedimiento

  1. Consulte el informe de resumen.
    El informe de resumen contiene la siguiente información para cada elemento de carga:
    Información incluida dentro del informe de resumen de carga de datos
    Información de elemento de carga Descripción:
    Configuración de objeto de negocio El nombre de la configuración de objeto de negocio utilizada.
    Modalidad de carga de datos La modalidad especificada para el proceso de carga de datos.
    Tamaño de lote El valor de tamaño de lote especificado en el archivo de configuración.
    Número de compromisos El valor de número de compromisos especificado en el archivo de configuración.
    Nivel de tolerancia de errores El nivel de tolerancia de errores como se especifica en el archivo de configuración.
    Número de errores El número de errores generados.
    Cantidad de datos procesados Si está utilizando el lector CSV predeterminado, este número indica el número de líneas que se procesan en el archivo de origen CSV.
    Cantidad de objetos de negocio procesados El número de objetos de datos devueltos por el lector de datos. Un objeto de datos devuelto puede construirse en varios objetos de negocio. Pero en la mayoría de los casos, un objeto de datos devuelto se construye en un objeto de negocio.
    Cantidad de objetos de negocio comprometidos El número de objetos de negocio construidos que se guardan en la base de datos o en los archivos. Este valor depende de cómo está configurado el grabador de datos.
    Nota: Este valor corresponde al número de objetos de negocio construidos y cargados que se procesan sin errores. Este valor no se corresponde necesariamente con el número de registros actualizados en la base de datos. Para cada objeto de negocio construido a partir de un archivo de origen de carga de datos, el mediador utilizado puede actualizar cero, uno o varios registros de base de datos basándose en su propia lógica de procesamiento.
    Tiempo de inicialización del cargador de datos El tiempo de inicialización del cargador de datos.
    La ejecución del cargador de datos empezó La hora de inicio del proceso de carga de datos en segundos.
    La ejecución del cargador de datos finalizó La hora de finalización del proceso de carga de datos en segundos.
    El cargador de datos se completó en El tiempo total de ejecución de la carga de datos en segundos.
    Tiempo total de vaciado El tiempo total que se tarda en llamar a la ejecución por lotes JDBC. Esta información solo es útil si el lote JDBC está habilitado (es decir, el tamaño del lote es mayor que 1.) Si el lote JDBC está habilitado, es el tiempo total empleado en ejecutar todas las declaraciones SQL.
    Tiempo total de compromiso El tiempo total que se tarda en llamar al compromiso de base de datos. El tiempo suele ser muy corto y no es útil.
    Tiempo total de programa de resolución de ID El tiempo que tarda el programa de resolución de ID en resolver y comprobar ID.
    Ubicación del archivo CSV La ubicación de los datos de origen.
    Nombre de tabla, número de filas afectadas Los nombres de las tablas de base de datos que se actualizan y el número total de filas para cada tabla que se ve afectada por el proceso de carga.
    El número de operaciones de inserción, actualización y supresión que se llevan a cabo se incluyen con el número total de filas afectadas para una tabla. El número de filas afectadas es el número de operaciones SQL que se ejecutan respecto a filas en una tabla. Puede haber una discrepancia entre el número de operaciones que se ejecutan en relación con las filas de tabla y el número real de filas afectadas. Por ejemplo, si se ejecuta una operación de supresión y se produce una supresión en cascada, el informe de resumen podría identificar únicamente las filas que se suprimen por la operación inicial, no la supresión en cascada resultante.
    Nota: Si el sitio utiliza espacios de trabajo, el número de operaciones de inserción, actualización y supresión en el informe de resumen se calculan basándose en las operaciones frente a las tablas de espacio de trabajo. Por ejemplo, una operación de supresión dentro de un espacio de trabajo puede causar una operación de inserción o actualización en una tabla de espacio de trabajo en lugar de una operación de supresión en una tabla base. El informe de resumen incluye únicamente la operación de inserción o actualización inicial, no la operación de supresión que se produce una vez que se ha completado el proceso de carga y se han aprobado los cambios de espacio de trabajo.

    Un informe de resumen de ejemplo:

    
    ===============================================================================
    HCL Commerce Data Load
    ===============================================================================
    
    Load started at: Thu Sep 05 09:05:59 EDT 2013
    Initialization completed in 2.229 seconds.
    
    Processing CatalogEntry...
    
    ----------------------------------------------------------------------------------
    Load summary for load item: CatalogEntry.
    ----------------------------------------------------------------------------------
    Business Object Configuration: wc-loader-catalog-entry.xml
    Data loader mode: Replace.
    Batch size: 1.
    Commit count: 100.
    Error Tolerance Level: 1.
    Error Count: 0.
    Amount of business objects processed: 13.
    Amount of business objects committed: 13.
    Data loader initialization time: 0 seconds.
    Data loader execution began: Thu Sep 05 09:06:07 EDT 2013
    Data loader execution ended: Thu Sep 05 09:06:13 EDT 2013
    Data loader completed in 5.765 seconds. 
    Total flush time: 0 seconds.
    Total commit time: 0.003 seconds.
    Total ID resolver time: 1.138 seconds.
    CSV file location: C:\IBM\WCDE_ENT70\bin\..\samples\DataLoad\Catalog\CatalogEntries.csv.
    Affected tables (13):
    Table                |     Total |    Insert |    Update |    Delete 
    ---------------------|-----------|-----------|-----------|-----------
    BASEITEM             |         5 |         0 |         5 |         0 
    BASEITMDSC           |         5 |         0 |         5 |         0 
    STOREITEM            |         5 |         0 |         5 |         0 
    ITEMVERSN            |         5 |         0 |         5 |         0 
    DISTARRANG           |         5 |         0 |         5 |         0 
    CATENTRY             |        13 |         0 |        13 |         0 
    STORECENT            |        13 |         0 |        13 |         0 
    CATENTDESC           |        13 |         0 |        13 |         0 
    CATGPENREL           |        13 |         0 |        13 |         0 
    LISTPRICE            |        13 |         0 |        13 |         0 
    ITEMSPC              |         8 |         0 |         8 |         0 
    VERSIONSPC           |         8 |         0 |         8 |         0 
    CATENTREL            |         8 |         0 |         8 |         0 
    
    ----------------------------------------------------------------------------------
    
    Program exiting with exit code: 0. 
    Load completed successfully with no errors.
    
    Load ended at: Thu Sep 05 09:06:13 EDT 2013
    Load completed in 13.901 seconds.
  2. Abra el archivo wc-dataload.log en el directorio siguiente:
    • HCL Commerce DeveloperWCDE_installdir\logs
    • Linuxutilities_root/logs
    El valor de salida del sistema se visualiza en el archivo wc-dataload.log o en el informe de resumen, indica lo siguiente:
    1. Si el programa de utilidad de carga de datos termina satisfactoriamente sin errores, el valor de salida del sistema es 0.
    2. Si el programa de utilidad de carga de datos termina con algunos errores (menos errores que el valor de maxError), el valor de salida del sistema es 1.
    3. Si el programa de utilidad de carga de datos termina antes de tiempo porque uno de los números de error de DataLoader alcanza el valor de maxError, el valor de salida del sistema es 2.
    4. Si el programa de utilidad de carga de datos termina antes de tiempo debido a algún error irrecuperable, como com.ibm.commerce.foundation.dataload.exception.DataLoadConfigException y com.ibm.commerce.foundation.dataload.exception.DataLoadSystemException, el valor de salida del sistema es 3.
    A continuación se describen algunas excepciones que pueden aparecer en el informe:
    DataLoadSystemException
    Este error se produce cuando hay algunos errores del sistema. Un ejemplo de error del sistema es la excepción de punto muerto de base de datos y una excepción de memoria agotada.
    DataLoadSQLException
    Este error se produce cuando la carga de datos ejecuta alguna sentencia SQL y la base de datos genera una excepción.
    DataLoadConfigException
    Este error se produce cuando el archivo de configuración contiene elementos incompletos o el contenido del elemento es incorrecto.
    DataLoadApplicationException
    Este error se produce cuando el archivo de origen de datos de entrada tiene registros erróneos.
  3. Opcional: Si se produce un error, abra el registro de errores en el mismo directorio. El nombre de archivo del registro de errores contiene el nombre del elemento de carga, así como la fecha y hora en que se produjo el error.
    Por ejemplo, si se ha producido un error para LoadItem CatalogGroup, el nombre de archivo podría ser CatalogGroup_ERROR_2009.08.26_14.54.21.406.log. Los registros de errores contienen la siguiente información:
    • Ubicación de la vía de acceso de archivo del registro de errores.
    • Los mensajes de aplicación y de excepción que se generaron.
  4. Opcional: Si configura el programa de utilidad de carga de datos para ejecutar un preprocesador de diferencias de archivos, la información para el preproceso se incluye en el informe de resumen generado. Esta información puede ayudar a verificar que el preproceso de diferencias de archivos se ha completado satisfactoriamente. Esta información también puede identificar si puede ahorrar tiempo generando y cargando un archivo diferencias en lugar de cargar el nuevo archivo completo.
    Información incluida dentro de la información del informe de resumen de carga de datos para el preprocesador de diferencias de archivos
    Información de elemento de carga para el preprocesador de diferencias de archivos Descripción:
    El número de registros en el nuevo archivo El número de objetos de datos devueltos por el lector de datos para el nuevo archivo respecto al que está ejecutando una diferencia de archivos.
    El número de registros en el archivo de diferencias generado El número de objetos de datos devueltos por el preproceso de diferencias de datos y que se incluyen en el archivo de diferencias. Estos registros son los registros del nuevo archivo que han modificado, o no existen en, el archivo con el que se compara el nuevo archivo.
    El tiempo para generar el archivo de diferencias: El tiempo que es necesario para generar el archivo de diferencias en segundos.
    El tiempo para cargar solo el archivo de diferencias: El tiempo que es necesario para cargar únicamente el archivo de diferencias en segundos.
    El tiempo total para generar y cargar el archivo de diferencias: El tiempo de ejecución total para generar y cargar el archivo de diferencias en segundos.
    El tiempo de carga estimado para cargar el nuevo archivo completo El tiempo estimado que es necesario para cargar el nuevo archivo sin ejecutar un preproceso de diferencias de archivos en segundos.
    El porcentaje estimado del tiempo de carga que se ahorra ejecutando el preprocesador de diferencias de archivos y cargando solo las diferencias de archivos: El tiempo de carga estimado que se ahorra ejecutando el preproceso de diferencias de archivos y cargando solo el archivo de diferencias en lugar del archivo nuevo completo. El tiempo que se ahorra se calcula como porcentaje del tiempo de carga estimado para la carga del nuevo archivo completo con la siguiente fórmula:
    ( (full_file_load_time - file_diff_time) / full_file_load_time) x 100%
    Donde
    • file_diff_time es el valor del tiempo total para generar y cargar el archivo de diferencias.
    • full_file_load_time es el valor para el tiempo de carga estimado para cargar el archivo nuevo completo.

    El informe de resumen con la información de diferencias de archivos puede parecerse al siguiente informe de ejemplo:

    Load summary for load item: CatalogEntry
    -----------------------------------------------------------------------------
    --
    Business Object Configuration: wc-loader-catalog-entry.xml
    Data loader mode: Replace.
    Batch size: 1.
    Commit count: 100.
    Error Tolerance Level: 1.
    Error Count: 0.
    Amount of data processed: 8.
    Amount of business objects processed: 6.
    Amount of business objects committed: 6.
    Data loader initialization time: 0 seconds.
    Data loader execution began: Thu Mar 10 10:52:06 EDT 2013
    Data loader execution ended: Thu Mar 10 10:52:06 EDT 2013
    Data loader completed in 1.208 seconds.
    Total flush time: 0.002 seconds.
    Total commit time: 0.003 seconds.
    The number of records in the new file WebSphere/utilities_root/samples/DataLoad/Sample/CatalogEntriesNew.csv: 15 records
    The number of records in the generated difference file WebSphere/utilities_root/samples/DataLoad/Sample/CatalogEntriesNew_diff_2013.03.10_10.52.05.501.csv: 5 records
    The time for generating the difference file: 0.028 seconds.
    The time for loading only the difference file: 1.18 seconds.
    The total time for generating and loading the difference file: 1.208 seconds.
    The estimated loading time for loading the full new file WebSphere/utilities_root/samples/DataLoad/Sample/CatalogEntriesNew.csv: 3.54 seconds
    The estimated percentage of loading time that is saved by running the file difference preprocessor and loading only the file differences: 65%.
    CSV file location: WebSphere/utilities_root/samples/DataLoad/Sample/CatalogEntriesNeww_diff_2013.03.10_10.52.05.501.csv.
    Affected tables (14):
    Table name: BASEITEM, Affected number of rows: 4.
    Table name: BASEITMDSC, Affected number of rows: 4.
    Table name: STOREITEM, Affected number of rows: 4.
    Table name: ITEMVERSN, Affected number of rows: 4.
    Table name: DISTARRANG, Affected number of rows: 4.
    Table name: CATENTRY, Affected number of rows: 6.
    Table name: STORECENT, Affected number of rows: 4.
    Table name: CATENTDESC, Affected number of rows: 4.
    Table name: CATGPENREL, Affected number of rows: 4.
    Table name: LISTPRICE, Affected number of rows: 4.
    Table name: OFFER, Affected number of rows: 4.
    Table name: OFFERPRICE, Affected number of rows: 4.
    Table name: ITEMSPC, Affected number of rows: 2.
    Table name: TI_DELTA_CATENTRY, Affected number of rows: 5.
    -----------------------------------------------------------------------------
    --
    
  5. Opcional: Si ha configurado el programa de utilidad de carga de datos para obtener información relacionada con el proceso del programa de resolución de ID, esta información se incluye en el informe de resumen. Esta información puede ayudarle a determinar cuánto tiempo es necesario para resolver y comprobar ID durante el proceso de carga. Con esta información, puede identificar si sería más eficiente resolver y comprobar ID para una tabla respecto a la memoria caché del programa de resolución de ID o directamente respecto a la base de datos.
    Para incluir la información del programa de resolución de ID en el informe de resumen de carga de datos, debe incluir la propiedad de configuración summaryReportLevel en el archivo de configuración del orden de carga de datos. Para obtener más información sobre la configuración de este archivo y las propiedades de configuración disponible, consulte Si identifica que la resolución de ID para una tabla en relación con la memoria caché es ineficaz, puede excluir de la memoria caché los ID para dicha tabla. Para evitar que una tabla se incluya dentro de la memoria caché del programa de resolución de ID, debe configurar la propiedad de configuración de IDResolver dentro del archivo de configuración del entorno de carga de datos. Para obtener más información, consulte Configurar los valores de entorno de carga de datos.
    Si el archivo de configuración de orden de carga de datos se configura de modo que incluya la información del programa de resolución de ID en el informe de resumen de carga de datos, la siguiente información se incluye en el informe.
    La información incluida dentro del informe de resumen de carga de datos para el programa de resolución de ID
    Información de elemento de carga para el programa de resolución de ID Descripción:
    ResolveId de la memoria caché La información para el proceso de resolución de ID que se lleva a cabo respecto a la memoria caché del programa de resolución de ID.
    Tiempo de carga (seg) El tiempo necesario para captar y cargar los ID en la memoria caché del programa de resolución de ID.
    Entradas El número de entradas dentro de la memoria caché para la tabla.
    Accesos El número de aciertos en la memoria caché para resolver los ID para la tabla.
    ResolveId de la base de datos La información para el proceso de resolución de ID que se realiza directamente en relación con la tabla de base de datos.
    Tiempo (seg) El tiempo que es necesario para resolver los ID directamente de la base de datos para la tabla.
    Accesos El número de aciertos en la base de datos para resolver los ID para la tabla.
    El informe de resumen incluye una sección adicional que puede parecerse al siguiente resumen del programa de resolución de ID de ejemplo.
    Table                |          ResolveId from cache          |  ResolveId from database   
                         |Load Time (sec) |   Entries |      Hits |     Time (sec) |      Hits 
    ---------------------|----------------|-----------|-----------|----------------|-----------
    ATTRDICT             |          0.011 |         2 |         1 |            0.0 |         0 
    BASEITEM             |          0.055 |      1241 |        13 |            0.0 |         0 
    BASEITMDSC           |          0.246 |     16008 |         5 |            0.0 |         0 
    CATENTDESC           |          0.226 |     84292 |        13 |            0.0 |         0 
    CATENTREL            |          0.028 |      5270 |         8 |            0.0 |         0 
    CATENTRY             |          0.092 |      6497 |        21 |            0.0 |         0 
    CATGPENREL           |          0.044 |      6496 |        13 |            0.0 |         0 
    CATGROUP             |            0.0 |       131 |        23 |            0.0 |         0 
    CATGRPDESC           |            0.0 |         0 |         6 |            0.0 |         0 
    CATGRPREL            |            0.0 |         0 |         4 |            0.0 |         0 
    CATTOGRP             |            0.0 |         0 |         2 |            0.0 |         0 
    DISTARRANG           |          0.057 |      1238 |         5 |            0.0 |         0 
    ITEMSPC              |          0.091 |      5259 |         8 |            0.0 |         0 
    ITEMVERSN            |           0.02 |      1241 |        13 |            0.0 |         0 
    LISTPRICE            |          0.066 |      6489 |        13 |            0.0 |         0 
    STORECENT            |          0.014 |      6496 |        13 |            0.0 |         0 
    STORECGRP            |            0.0 |         0 |         6 |            0.0 |         0 
    STOREITEM            |          0.047 |      1240 |         5 |            0.0 |         0 
    VERSIONSPC           |          0.097 |      5259 |         8 |            0.0 |         0 
    ---------------------|----------------|-----------|-----------|----------------|-----------
    Total                |          1.094 |    147159 |       180 |            0.0 |         0 
    
    Nota: Puede configurar el programa de utilidad de carga de datos de modo que excluya tablas específicas de la memoria caché del programa de resolución de ID. Considere excluir una tabla cuando la tabla cumple las condiciones siguientes:
    • La tabla es grande
    • Cargar los ID de la tabla en la memoria caché tarda mucho tiempo
    • La memoria caché no recibe muchos accesos para resolver ID para la tabla
    La exclusión de una tabla hace que el programa de resolución de ID resuelva los ID directamente respecto a la tabla de base de datos. Si se resuelven los ID en relación con la tabla de base de datos se podrá ahorrar tiempo en la resolución de los ID o reducir el uso de memoria. Para excluir una tabla, debe configurar el archivo de configuración del entorno de carga de datos. Especifique la tabla que se debe excluir en un elemento <_config:ExcludeCache> dentro del elemento <_config:IDResolver>.
    Nota: Para obtener más información sobre cómo configurar este archivo, consulte Configurar los valores de entorno de carga de datos.