サンプル・グループへのコンタクトの分割

ターゲットとコントロール・グループを作成するには、サンプル・プロセスを使用します。サンプリングの方法は複数あります。 「ランダム」は統計的に有効なコントロール・グループまたはテスト・セットを作成します。「データをソート順に各サンプルに配分」は、レコードを 1 つおきにサンプル・グループに割り振ります。「データをソート順に分割」は、多数のレコードをサンプルに順次割り振ります。

手順

  1. フローチャートを編集用に開きます。
  2. サンプル・プロセス 2 組の頭 をパレットからフローチャートにドラッグします。
  3. 少なくとも 1 つの構成済みプロセス (選択プロセスなど) を入力としてサンプル・プロセス・ボックスに接続します。
  4. フローチャートでサンプル・プロセスをダブルクリックします。
  5. 「サンプル」タブの「入力」リストを使用して、サンプリングするセルを選択します。リストには、サンプル・プロセスに接続されたプロセスのすべての出力セルが含まれています。複数のセルによって入力が提供されている場合、オプションとして「複数セル」オプションを選択できます。複数のソース・セルが選択されている場合、各ソース・セルで同じサンプリングが実行されます。
    注: 選択されたセルはすべて、世帯や顧客など、同じオーディエンス・レベルで定義されていなければなりません。
  6. 「サンプル数」フィールドを使用して、入力セルごとに作成するサンプルの数を指定します。デフォルトでは、入力セルごとに 3 つのサンプルが作成され、デフォルト名の「サンプル1」、「サンプル2」、および「サンプル3」が使用されます。
  7. デフォルトのサンプル名を変更するには、「出力名」列でサンプルをダブルクリックしてから、新しい名前を入力します。文字、数字、およびスペースの任意の組み合わせを使用できます。ピリオド (.) またはスラッシュ (/ または ) は使用しないでください。
    重要: サンプルの名前を変更する場合は、入力セルとしてこのサンプルを使用するすべての後続プロセスを更新する必要があります。サンプル名を変更すると、接続された後続のプロセスが構成解除される場合があります。通常、サンプル名の編集は、後続のプロセスを接続する前に行う必要があります。
  8. 以下のいずれかの方法を使用して、サンプル・サイズを定義します。
    • パーセントでレコードを分割する場合:「パーセント (%) でサイズを指定」を選択した後、「サイズ」フィールドをダブルクリックし、各サンプルで使用するレコードのパーセントを指定します。サンプルのサイズを制限する場合は、「最大サイズ」フィールドを使用します。デフォルトは「無制限」です。「出力名」列にリストされているそれぞれのサンプルで繰り返すか、または「残りすべて」チェック・ボックスを使用して、残りのすべてのレコードをそのサンプルに割り当てます。「残りすべて」が選択できるのは、1 つの出力セルに対してのみです。
    • 各サンプル・サイズにレコード数を指定する場合:「レコード数でサイズを指定します」を選択した後、「最大サイズ」フィールドをダブルクリックして、最初のサンプル・グループに割り振るレコードの最大数を指定します。リストされている次のサンプルに対して「最大サイズ」を指定するか、または「残りすべて」チェック・ボックスを使用して、残りのすべてのレコードをそのサンプルに割り当てます。「残りすべて」が選択できるのは、1 つの出力セルに対してのみです。

      オプション:「サンプル・サイズ計算」をクリックし、計算器を使用して最適なサンプル・サイズを決定します。( サンプル・サイズ計算器についてを参照) 値を計算器の「最小サンプル・サイズ」フィールドからコピーし、「完了」をクリックして計算器を閉じてから、「レコード数でサイズを指定」「最大サイズ」フィールドに値を貼り付けます。

  9. 「出力名」リストの各サンプルについて、「サイズ」が定義されているか、または「残りすべて」にチェック・マークが付いていることを確認します。
  10. 「サンプリング方法」セクションで、以下のいずれかのオプションを使用して、サンプルの作成方法を指定します。
    • ランダム・サンプル: 統計的に有効なコントロール・グループまたはテスト・セットを作成する場合に、このオプションを使用します。このオプションは、指定されたシードに基づいて乱数発生ルーチンを使用して、サンプル・グループにレコードをランダムに割り当てます。シードについては、これらのステップの後半で説明しています。
    • データをソート順に各サンプルに配分: このオプションは、最初のレコードを最初のサンプルに、2 番目のレコードを 2 番目のサンプルに配置するという方法で、指定されたサンプル数になるまでレコードを順番に配置します。このプロセスは、すべてのレコードがサンプル・グループに割り当てられるまで繰り返されます。このオプションを使用するには、「ソート条件」オプションを指定して、グループへのレコードのソート方法を決定する必要があります。「ソート条件」オプションについては、これらのステップの後半で説明しています。
    • データをソート順に分割: このオプションは、最初の N 件のレコードを最初のサンプルに、次のレコードのセットを 2 番目のサンプルに割り振るという方法で、レコードを順番に割り振ります。このオプションは、ソートされた何らかのフィールド (例えば、累積の購買額またはモデル・スコアなど) に基づくトップ十分位数 (またはその他の何らかのサイズ) をベースとしてグループを作成する場合に有用です。このオプションを使用するには、「ソート条件」オプションを指定して、グループへのレコードのソート方法を決定する必要があります。「ソート条件」オプションについては、これらのステップの後半で説明しています。
  11. 「ランダム・サンプル」を選択した場合は、ほとんどの場合にデフォルトのシードを受け入れます。「乱数シード」は、IBM® Campaign で ID をランダムに選択するために使用する開始点を表します。

    新しいシード値を生成するには、「選択」をクリックするか「乱数シード」フィールドに値を入力します。新規シード値を使用する必要がある場合の例は次のとおりです。

    • 全く同じ数のレコードが同じシーケンスに存在し、同一のシード値を使用すると、レコードが毎回同じサンプルに作成される場合。
    • ランダム・サンプルが望ましくない結果をもたらしている場合 (例えば、すべての男性が 1 つのグループに割り振られ、すべての女性が別のグループに割り振られるなど)。
    注: その同じランダムなレコードのセットが、その後に続く各サンプル・プロセスの実行で使用されます (プロセスへの入力が変更されない場合)。結果をモデリングに使用する場合、このことは重要になります。各モデルの有効性を判断するには、同じレコードのセットで異なるモデリング・アルゴリズムを比較する必要があるからです。結果をモデリングに使用しない場合は、サンプル・プロセスを実行するたびに異なるランダムなレコードのセットが選択されるようにできます。これを行うには、ゼロ (0) のランダム・シードを使用します。値を 0 にすると、プロセスが実行されるたびに異なるランダムなレコードのセットが選択されます。
  12. 「データをソート順に各サンプルに配分」または「データをソート順に分割」を選択した場合、ソート方法を指定して、レコードがサンプル・グループに割り振られる方法を決定する必要があります。
    1. ドロップダウン・リストから「ソート条件」フィールドを選択するか、「ユーザー定義フィールド」をクリックして、ユーザー定義フィールドを使用します。
    2. 「昇順」を選択して、数値フィールドを昇順 (低から高へ) でソートするか、英字フィールドをアルファベット順にソートします。「降順」を選択すると、ソート順が逆になります。
  13. 「全般」タブは、以下のように使用します。
    1. プロセス名: 記述名を割り当てます。プロセス名は、フローチャートでボックス・ラベルとして使用されます。また、ダイアログやレポートでプロセスを識別するためにも使用されます。
    2. 出力セル名: デフォルトでは、出力セル名は、プロセス名、およびその後続のサンプル名と 1 桁の数字から構成されます。これらの名前は、ダイアログやレポートで使用されます。出力セル名を変更する場合は、出力セル名をダブルクリックして、フィールドに入力します。または、「コピー」ボタンをクリックして、既存のすべての出力セル名を表示するテキスト・ボックスを開きます。それらを手動でコピーし、「OK」をクリックします。「貼り付け」ボタンをクリックして、テキスト・ボックスにそれらを貼り付け、編集します。「OK」をクリックして、編集した出力セル名をフィールドにコピーします。デフォルトの出力セル名に戻す場合は、「セル名のリセット」ボタンを使用できます。
    3. セル・コード: セル・コードには標準形式があり、システム管理者によって決定されます。生成されたセル・コードは固有です。セル・コードの変更は、それが及ぼす影響を把握していない場合は行わないでください。デフォルトでは、プロセス内で作成されるセルの名前はそのプロセス名と一致します。出力セル名への変更を保存すると、「セル・コードを自動生成」が選択されている場合は、セル・コードが再生成されます。セル・コードを変更したくない場合は、「セル・コードを自動生成」のチェック・マークを外しておきます。セル名およびセル・コードを参照してください。
    4. :「説明」フィールドを使用して、プロセスの目的または結果を説明します。フローチャート内のプロセス・ボックス上にカーソルを置くと、このフィールドの内容が表示されます。
  14. 「OK」をクリックします。

タスクの結果

プロセスが構成され、フローチャートで使用可能になります。予期される結果をプロセスが返すかどうかを確認するために、プロセスの実行をテストできます。