ノイズの取り扱い

集計可能なレポートでノイズを扱い、考慮し、影響を軽減する方法について学びます。

始める前に

ノイズとその影響について詳しくは、概要レポートのノイズについて理解するをご覧ください。

騒音に関する管理

集計可能なレポートに追加されるノイズを直接制御することはできませんが、影響を最小限に抑えるための手順があります。以降のセクションでは、これらの戦略について説明します。

コントリビューション バジェットまでスケールアップする

ノイズの理解で説明したように、各キーの概要の値に適用されるノイズは、0 ~ 65,536 のスケール(0 ~CONTRIBUTION_BUDGET)に基づいています。

ノイズの分散は予算に基づいています。

そのため、ノイズと比較してシグナルを最大化するには、各値を集計可能な値として設定する前にスケールアップする必要があります。つまり、各値に一定の係数(スケーリング係数)を掛けて、貢献度予算内に収まるようにします。

スケーリングありとスケーリングなしの相対ノイズ。

スケーリング ファクタの計算

スケーリング ファクタは、特定の集計可能な値をスケーリングする量を表します。この値は、コントリビューション 予算を特定のキーの最大集計値で割った値にする必要があります。

コントリビューション バジェットに基づくスケーリング ファクタの決定。

たとえば、広告主が購入総額を知りたいとします。個々の購入の予想される最大購入額は $2,000 であることがわかっています。ただし、無視することにしたいくつかの外れ値があります。

  • スケーリング ファクタを計算する
    • シグナル対ノイズ比を最大化するには、この値を 65,536(コントリビューション バジェット)にスケーリングする必要があります。
    • 65,536 ÷ 2,000 で、約 32x のスケーリング ファクタになります。実際には、この係数を切り上げまたは切り捨てることができます。
  • 集計前に値をスケールアップする。購入金額が 1 ドル増えるごとに、トラッキング対象の指標が 32 ずつ増加します。たとえば、$120 の購入の場合は、集計可能な値を 120*32 = 3,840 に設定します。
  • 集計後に値をスケールダウンする。複数のユーザーの購入額の合計を含む概要レポートを受け取ったら、集計前に使用したスケーリング ファクタを使用して概要値を縮小します。この例では、集計前に 32 のスケーリング ファクタを使用しているため、サマリー レポートで受け取ったサマリー値を 32 で割る必要があります。したがって、概要レポートで特定のキーの概要の購入額が 76,800 の場合、概要の購入額(ノイズを含む)は 76,800/32 = 2,400 ドルになります。

予算を分割する

購入数や購入額など、複数の測定目標がある場合は、これらの目標に予算を分割することをおすすめします。

この場合、集計値ごとにスケーリング係数は異なります。これは、特定の集計値の予想最大値によって異なります。

詳細については、集計キーについてをご覧ください。

たとえば、購入数と購入額の両方をトラッキングしていて、予算を均等に割り当てることにしたとします。

測定タイプとソースごとに 65,536 ÷ 2 = 32,768 個を割り当てることができます。

  • 購入回数:
    • トラッキング対象の購入が 1 件のみであるため、1 件のコンバージョンにつき購入の最大数は 1 件です。
    • したがって、購入数のスケーリング ファクタを 32,768 ÷ 1 = 32,768 に設定することにします。
  • 購入額:
    • 個々の購入の最大予想購入額が 2,000 ドルであるとします。
    • したがって、購入額のスケーリング係数を 32,768 ÷ 2,000 = 16.384(約 16)に設定することにします。

集計キーの粒度を粗くすると、信号対雑音比が改善される

大まかなキーは詳細なキーよりも多くのコンバージョン イベントをキャッチするため、通常、大まかなキーを使用すると概要値が高くなります。

概要の値が高いほど、低い値よりもノイズの影響を受けにくくなります。これらの値のノイズは、この値に比べて低くなる傾向があります。

より粗いキーで収集された値は、より詳細なキーで収集された値よりもノイズが比較的少ない傾向があります。

他の条件が同じであれば、購入額を全世界(すべての国を合計)でトラッキングするキーを使用すると、国単位でコンバージョンをトラッキングするキーを使用する場合よりも、概算の購入額(および概算のコンバージョン数)が大きくなります。

したがって、特定の国の合計購入額の相対的なノイズは、すべての国の合計購入額の相対的なノイズよりも大きくなります。

同様に、他の条件がすべて同じ場合、靴の合計購入額は、すべての商品(靴を含む)の合計購入額よりも低くなります。

したがって、靴の合計購入額の相対的なノイズは、すべての商品の合計購入額の相対的なノイズよりも大きくなります。

詳細なキーと大まかなキーのノイズへの影響。

概要値(ロールアップ)を合計すると、ノイズも合計されます

概要レポートの概要値を合計して上位レベルのデータにアクセスすると、これらの概要値のノイズも合計されます。

ロールアップありのきめ細かいキーと、ロールアップなしの粗いキーのノイズの程度。

2 つの異なるアプローチを見てみましょう。 - アプローチ A: キーに地域 ID を含めます。概要レポートには、地域 ID レベルのキーが表示されます。各キーは、特定の地域 ID レベルの概要購入額に関連付けられています。- アプローチ B: キーに地域 ID を含めません。概要レポートには、すべての地域 ID / 地域の概要購入額が直接表示されます。

国レベルの購入額にアクセスするには: - アプローチ A では、ジオ ID レベルの概要値を合計するため、ノイズも合計されます。これにより、最終的なジオ ID レベルの購入額にノイズが追加される可能性があります。- アプローチ B では、概要レポートに表示されるデータを直接確認します。ノイズは 1 回だけ追加されています。

したがって、アプローチ A では、特定のジオ ID の概要の購入額にノイズが多く含まれる可能性があります。

同様に、キーに郵便番号レベルのディメンションを含めると、地域レベルのディメンションを使用するより、ノイズの多い結果になる可能性があります。

長い期間にわたって集計すると、信号対雑音比が高くなります

概要レポートのリクエスト頻度を下げると、各概要値は、レポートを頻繁にリクエストした場合よりも高くなる傾向があります。長い期間にコンバージョンが発生する可能性が高いためです。

前述のように、概要の値が高ければ高いほど、相対的なノイズは低くなる傾向があります。したがって、概要レポートのリクエスト頻度を下げることで、信号雑音比が向上します。

概要レポートのリクエスト頻度を下げると、信号対雑音比が高くなります

次の例で説明します。

  • 24 時間にわたって 1 時間ごとの概要レポートをリクエストし、各 1 時間ごとのレポートの概要値を合計して 1 日単位のデータにアクセスする場合、ノイズは 24 回追加されます。
  • 1 つの日次概要レポートでノイズが追加されるのは 1 回のみです。

イプシロンが大きいほど、ノイズは小さくなります。

イプシロンの値が大きいほど、ノイズは少なくなりますが、プライバシー保護は低下します。

フィルタリングと重複除去を活用する

さまざまなキーに予算を割り当てる際には、特定のイベントが発生する回数を把握することが重要です。たとえば、広告主様はクリックごとに 1 件の購入のみを重視し、商品ページの閲覧コンバージョンは最大 3 件まで重視する場合もあります。このようなユースケースをサポートするために、次の API 機能を利用して、生成されるレポートの数やカウントされるコンバージョンを制御することもできます。

イプシロンをテストする

広告テクノロジーは、イプシロンを 0 より大きく 64 以下の値に設定できます。この範囲では、柔軟なテストが可能です。イプシロンの値が小さいほど、プライバシー保護は強くなります。最初は epsilon=10 から始めることをおすすめします。

テストにおすすめ

次のようにすることをおすすめします。 - epsilon = 10 から始めます。- ユーティリティに大きな問題が発生した場合は、ε を段階的に増やします。- データのユーザビリティに関する特定の変化点についてフィードバックを共有してください。

フィードバックを共有

この API に参加して試すことができます。

次のステップ