วิธีการทำงาน

บริการรวมข้อมูลช่วยให้เทคโนโลยีโฆษณามีข้อมูลเชิงลึกด้านประสิทธิภาพที่จําเป็นในการปรับปรุงประสิทธิภาพแคมเปญกับลูกค้า

เอกสารนี้ครอบคลุม

เอกสารนี้มีไว้สำหรับใคร

หน้านี้ช่วยให้เทคโนโลยีโฆษณาและนักพัฒนาซอฟต์แวร์เข้าใจวิธีที่ API ของเราช่วยให้การวัดผลโฆษณาที่มีประสิทธิภาพและรักษาความเป็นส่วนตัวได้

เอกสารนี้ถือว่าคุณคุ้นเคยกับ Private Aggregation API, Attribution Reporting API, Protected Audience API, Shared Storage และ Trusted Execution Environment

คําศัพท์และแนวคิดสําคัญ

ทำความคุ้นเคยกับคําศัพท์สําคัญต่อไปนี้ก่อนดําเนินการต่อ

อภิธานศัพท์

เทคโนโลยีโฆษณา

แพลตฟอร์มโฆษณาคือบริษัทที่ให้บริการแสดงโฆษณา

รายงานที่รวมได้

รายงานที่รวบรวมได้คือรายงานที่เข้ารหัสซึ่งส่งจากอุปกรณ์ของผู้ใช้แต่ละราย รายงานเหล่านี้มีข้อมูลเกี่ยวกับพฤติกรรมของผู้ใช้และ Conversion ข้ามเว็บไซต์ ผู้ลงโฆษณาหรือเทคโนโลยีโฆษณาจะกําหนด Conversion (บางครั้งเรียกว่าเหตุการณ์ทริกเกอร์การระบุแหล่งที่มา) และเมตริกที่เกี่ยวข้อง แต่ละรายงานได้รับการเข้ารหัสเพื่อป้องกันไม่ให้บุคคลต่างๆ เข้าถึงข้อมูลพื้นฐาน

ดูข้อมูลเพิ่มเติมเกี่ยวกับรายงานที่รวบรวมได้

การบัญชีรายงานที่รวบรวมได้

บัญชีแยกประเภทแบบกระจายที่อยู่ในผู้ประสานงานทั้ง 2 ราย ซึ่งติดตามงบประมาณความเป็นส่วนตัวที่จัดสรรและบังคับใช้กฎ "ไม่ซ้ำกัน" นี่เป็นกลไกการคุ้มครองความเป็นส่วนตัวที่ทำงานภายในผู้ประสานงาน ซึ่งช่วยให้มั่นใจว่าไม่มีรายงานใดส่งผ่านบริการรวบรวมข้อมูลเกินงบประมาณความเป็นส่วนตัวที่กำหนดไว้

อ่านเพิ่มเติมเกี่ยวกับความสัมพันธ์ระหว่างกลยุทธ์การแบ่งกลุ่มกับรายงานที่รวบรวมได้

งบประมาณการบัญชีของรายงานที่รวบรวมได้

การอ้างอิงงบประมาณที่ช่วยให้มั่นใจว่าระบบจะไม่ประมวลผลรายงานแต่ละรายการมากกว่า 1 ครั้ง

บริการรวมข้อมูล

บริการที่ดำเนินการโดยเทคโนโลยีโฆษณาซึ่งประมวลผลรายงานที่รวบรวมได้เพื่อสร้างรายงานสรุป

อ่านข้อมูลเพิ่มเติมเกี่ยวกับเบื้องหลังของบริการรวบรวมข้อมูลได้ในคำอธิบายและรายการข้อกำหนดฉบับเต็ม

การรับรอง

กลไกในการตรวจสอบสิทธิ์ข้อมูลระบุตัวตนของซอฟต์แวร์ โดยปกติจะใช้แฮชการเข้ารหัสหรือลายเซ็น สำหรับการเสนอบริการรวบรวมข้อมูล การรับรองจะจับคู่โค้ดที่ทำงานในบริการรวบรวมข้อมูลที่คุณดำเนินการโดยเทคโนโลยีโฆษณากับโค้ดโอเพนซอร์ส

อ่านเพิ่มเติมเกี่ยวกับเอกสารรับรอง

การเชื่อมโยงการมีส่วนร่วม
ผู้ประสานงาน

หน่วยงานที่รับผิดชอบการจัดการคีย์และการบัญชีรายงานที่รวบรวมได้ ผู้ประสานงานจะดูแลรักษารายการแฮชของการกำหนดค่าบริการรวบรวมข้อมูลที่อนุมัติและกำหนดค่าการเข้าถึงคีย์การถอดรหัส

เสียงรบกวนและการปรับขนาด

ข้อมูลรบกวนทางสถิติที่เพิ่มลงในรายงานสรุประหว่างกระบวนการรวบรวมเพื่อรักษาความเป็นส่วนตัวและตรวจสอบว่ารายงานสุดท้ายให้ข้อมูลการวัดผลโดยไม่ระบุตัวบุคคล

อ่านเพิ่มเติมเกี่ยวกับกลไกการเพิ่มสัญญาณรบกวนซึ่งดึงมาจากการแจกแจง Laplace

ที่มาของการรายงาน

บุคคลที่รับรายงานที่รวบรวมได้ กล่าวคือ คุณหรือเทคโนโลยีโฆษณาที่เรียกใช้ Attribution Reporting API ระบบจะส่งรายงานที่รวบรวมได้จากอุปกรณ์ของผู้ใช้ไปยัง URL ที่รู้จักกันดีซึ่งเชื่อมโยงกับต้นทางการรายงาน ต้นทางการรายงานจะกําหนดในระหว่างการลงทะเบียน

รหัสที่แชร์

ค่าที่คำนวณแล้วซึ่งประกอบด้วย shared_info, reporting_origin, destination_site (สําหรับ Attribution Reporting API เท่านั้น), source_registration-time (สําหรับ Attribution Reporting API เท่านั้น), scheduled_report_time และเวอร์ชัน

รายงานหลายรายการที่ใช้แอตทริบิวต์เดียวกันในช่อง shared_info ควรมีรหัสที่แชร์เดียวกัน รหัสที่แชร์มีบทบาทสําคัญในบัญชีรายงานที่รวบรวมได้

อ่านเพิ่มเติมเกี่ยวกับเซิร์ฟเวอร์ที่เชื่อถือได้

รายงานสรุป

ประเภทรายงาน Attribution Reporting API และ Private Aggregation API รายงานสรุปจะรวมข้อมูลผู้ใช้แบบรวม และอาจมีข้อมูล Conversion โดยละเอียดที่มีการเพิ่มสัญญาณรบกวน รายงานสรุปประกอบด้วยรายงานสรุป รายงานเหล่านี้มีความยืดหยุ่นมากขึ้นและมีโมเดลข้อมูลที่สมบูรณ์กว่าการรายงานระดับเหตุการณ์ โดยเฉพาะสําหรับกรณีการใช้งานบางรายการ เช่น มูลค่า Conversion

สภาพแวดล้อมการดำเนินการที่เชื่อถือได้ (TEE)

การกําหนดค่าฮาร์ดแวร์และซอฟต์แวร์คอมพิวเตอร์ที่ปลอดภัยซึ่งช่วยให้บุคคลภายนอกตรวจสอบเวอร์ชันที่แน่นอนของซอฟต์แวร์ที่ทํางานบนเครื่องได้โดยไม่ต้องกลัวว่าข้อมูลจะรั่วไหล TEE อนุญาตให้บุคคลภายนอกตรวจสอบได้ว่าซอฟต์แวร์ทํางานตามที่ผู้ผลิตซอฟต์แวร์กล่าวอ้างไว้ทุกประการ

ดูข้อมูลเพิ่มเติมเกี่ยวกับ TEE ที่ใช้สำหรับข้อเสนอ Privacy Sandbox ได้ที่คำอธิบายบริการ Protected Audience API และคำอธิบายบริการรวบรวมข้อมูล

เวิร์กโฟลว์ของบริการรวมข้อมูล

บริการรวบรวมข้อมูลจะสร้างรายงานสรุปของข้อมูล Conversion และข้อมูลการเข้าถึงแบบละเอียดจากรายงานดิบแบบรวมได้ ขั้นตอนการสร้างรายงานประกอบด้วยขั้นตอนต่อไปนี้

  1. เบราว์เซอร์จะดึงข้อมูลคีย์สาธารณะเพื่อสร้างรายงานที่เข้ารหัส
  2. ระบบจะส่งรายงานแบบรวมที่เข้ารหัสไปยังเซิร์ฟเวอร์เทคโนโลยีโฆษณา
  3. เซิร์ฟเวอร์เทคโนโลยีโฆษณาจะจัดกลุ่มรายงาน (ในรูปแบบ avro) และส่งไปยังบริการรวมข้อมูล
  4. Aggregation Worker จะดึงข้อมูลรายงานแบบรวมเพื่อถอดรหัส
  5. เวิร์กเกอร์การรวมข้อมูลจะดึงข้อมูลคีย์การถอดรหัสจากผู้ประสานงาน
  6. Aggregation Worker จะถอดรหัสรายงานเพื่อรวบรวมข้อมูลและเพิ่มสัญญาณรบกวน
  7. บริการบัญชีรายงานแบบรวมได้จะตรวจสอบว่ามีงบประมาณด้านความเป็นส่วนตัวเพียงพอที่จะสร้างรายงานสรุปสําหรับรายงานแบบรวมได้หรือไม่
  8. บริการรวมข้อมูลจะส่งรายงานสรุปขั้นสุดท้าย

แผนภาพต่อไปนี้แสดงการทํางานของบริการรวมข้อมูล ตั้งแต่เวลาที่รับรายงานจากเว็บและอุปกรณ์เคลื่อนที่ ไปจนถึงเวลาที่บริการรวมข้อมูลสร้างรายงานสรุป

ขั้นตอนบริการรวมข้อมูลจากต้นทางถึงปลายทาง
ขั้นตอนการใช้บริการรวมข้อมูลตั้งแต่ต้นจบ

กล่าวโดยสรุปคือ Attribution Reporting API หรือ Private Aggregation API จะสร้างรายงานจากอินสแตนซ์เบราว์เซอร์หลายรายการ Chrome จะได้รับคีย์สาธารณะซึ่งเปลี่ยนทุก 7 วันจากบริการโฮสติ้งคีย์ใน Coordinator เพื่อเข้ารหัสรายงานก่อนที่จะส่งไปยังแหล่งที่มาของการรายงานเทคโนโลยีโฆษณา แหล่งที่มาของการรายงานเทคโนโลยีโฆษณาจะรวบรวมและแปลงรายงานขาเข้าเป็นรูปแบบ avro และส่งไปยังบริการรวมข้อมูล เมื่อส่งคําขอกลุ่มไปยังบริการรวมข้อมูล บริการดังกล่าวจะดึงข้อมูลคีย์การถอดรหัสจากบริการโฮสติ้งคีย์ ถอดรหัสรายงาน และรวบรวมและเพิ่มสัญญาณรบกวนเพื่อสร้างรายงานสรุป ตราบใดที่มีงบประมาณความเป็นส่วนตัวเพียงพอที่จะสร้างรายงาน

ดูข้อมูลเพิ่มเติมเกี่ยวกับวิธีเตรียมรายงานที่รวบรวมข้อมูลได้ในส่วนการติดตั้งใช้งาน

การรวมรายงานที่รวมได้

ขั้นตอนการรายงานจะไม่สมบูรณ์หากไม่มีความช่วยเหลือจากเซิร์ฟเวอร์ต้นทางการรายงานที่กําหนด ซึ่งคุณระบุไว้ในระหว่างกระบวนการลงทะเบียน ต้นทางการรายงานมีหน้าที่รับผิดชอบในการรวบรวม เปลี่ยนรูปแบบ และจัดกลุ่มรายงานที่รวมได้ รวมถึงเตรียมรายงานเพื่อส่งไปยังบริการรวมข้อมูลใน Google Cloud หรือ Amazon Web Services อ่านเพิ่มเติมเกี่ยวกับวิธีเตรียมรายงานที่รวบรวมได้

คอมโพเนนต์ระบบคลาวด์

บริการรวมข้อมูลประกอบด้วยคอมโพเนนต์บริการระบบคลาวด์หลายรายการ คุณใช้สคริปต์ Terraform ที่ให้มาเพื่อจัดสรรและกําหนดค่าคอมโพเนนต์บริการระบบคลาวด์ที่จําเป็นทั้งหมด

คอมโพเนนต์ระบบคลาวด์ของบริการรวมข้อมูล
คอมโพเนนต์ระบบคลาวด์ของบริการรวมข้อมูล

บริการ Frontend

บริการระบบคลาวด์ที่มีการจัดการ: Cloud Function (Google Cloud) / API Gateway (Amazon Web Services)

บริการส่วนหน้าคือเกตเวย์แบบเซิร์ฟเวอร์เสมือนที่เป็นจุดแรกเข้าหลักสำหรับการเรียกใช้ Aggregation API เพื่อสร้างงานและดึงข้อมูลสถานะงาน โดยมีหน้าที่รับผิดชอบในการรับคําขอจากผู้ใช้บริการรวมข้อมูล ตรวจสอบพารามิเตอร์อินพุต และเริ่มกระบวนการกําหนดเวลาการทํางานของการเก็บรวบรวมข้อมูล

บริการส่วนหน้ามี API 2 รายการ ได้แก่

ปลายทาง คำอธิบาย
createJob API นี้จะทริกเกอร์งานบริการรวมข้อมูล ในการเรียกใช้งาน จะต้องมีข้อมูล เช่น รหัสงาน รายละเอียดพื้นที่เก็บข้อมูลอินพุต รายละเอียดพื้นที่เก็บข้อมูลเอาต์พุต และต้นทางการรายงาน
getJob API นี้จะแสดงสถานะของงานที่ระบุรหัสงาน ซึ่งจะแสดงข้อมูลเกี่ยวกับสถานะของงาน เช่น "ได้รับแล้ว" "อยู่ระหว่างดำเนินการ" หรือ "เสร็จสิ้นแล้ว" หากงานเสร็จสิ้นแล้ว ระบบจะแสดงผลลัพธ์ของงาน รวมถึงข้อความแสดงข้อผิดพลาดที่พบระหว่างการดำเนินการของงานด้วย

โปรดดูเอกสารประกอบของ Aggregation Service API

คิวงาน

บริการระบบคลาวด์ที่มีการจัดการ: Pub/Sub (Google Cloud) / Amazon SQS (Amazon Web Services)

คิวงานคือคิวข้อความที่มีคําของานสําหรับบริการรวมข้อมูล บริการส่วนหน้าจะแทรกคําของานลงในคิว จากนั้นผู้ปฏิบัติงานการรวมข้อมูลจะดึงข้อมูลดังกล่าวไปใช้ประมวลผล

Cloud Storage

บริการระบบคลาวด์ที่มีการจัดการ: Google Cloud Storage (Google Cloud) / Amazon S3 (Amazon Web Services)

ไฟล์อินพุตและเอาต์พุตที่บริการรวบรวมข้อมูลใช้ เช่น ไฟล์รายงานที่เข้ารหัสและรายงานสรุปเอาต์พุต จะจัดเก็บไว้ในพื้นที่เก็บข้อมูลระบบคลาวด์

ฐานข้อมูลข้อมูลเมตาของงาน

บริการระบบคลาวด์ที่มีการจัดการ: Spanner (Google Cloud) / DynamoDB (Amazon Web Services)

ฐานข้อมูลข้อมูลเมตาของงานใช้เพื่อจัดเก็บและติดตามสถานะงานรวม โดยจะบันทึกข้อมูลเมตา เช่น เวลาสร้าง เวลาขอ เวลาอัปเดต และสถานะ เช่น ได้รับ อยู่ระหว่างดำเนินการ หรือเสร็จสิ้น Aggregation Worker จะอัปเดตฐานข้อมูลข้อมูลเมตาของงานเมื่องานดำเนินการ

ผู้ปฏิบัติงานการรวมข้อมูล

บริการระบบคลาวด์ที่มีการจัดการ: Compute Engine ที่มีพื้นที่ทำงานที่ปลอดภัย (Google Cloud) / Amazon Web Services EC2 ที่มี Nitro Enclave (Amazon Web Services)

เวิร์กเกอร์การรวมจะประมวลผลคําของานในคิวงาน และถอดรหัสอินพุตที่เข้ารหัสโดยใช้คีย์ที่ดึงมาจากบริการสร้างและแจกจ่ายคีย์ (KGDS) ในผู้ประสานงาน ผู้ปฏิบัติงานการรวมข้อมูลจะแคชคีย์การถอดรหัสไว้เป็นเวลา 8 ชั่วโมงและใช้คีย์ดังกล่าวกับงานที่ประมวลผล

Aggregation Worker ทํางานภายในอินสแตนซ์ Trusted Execution Environment (TEE) ผู้ปฏิบัติงานจะจัดการงานได้ครั้งละ 1 งานเท่านั้น คุณสามารถกำหนดค่าผู้ปฏิบัติงานหลายรายให้ประมวลผลงานพร้อมกันได้โดยการตั้งค่าการปรับขนาดอัตโนมัติ หากใช้ การปรับขนาดอัตโนมัติจะปรับจำนวนผู้ปฏิบัติงานตามจำนวนข้อความในคิวงาน คุณสามารถกําหนดค่าจํานวนผู้ทํางานขั้นต่ำและสูงสุดสําหรับการปรับขนาดอัตโนมัติผ่านไฟล์สภาพแวดล้อม Terraform ดูข้อมูลเพิ่มเติมเกี่ยวกับการปรับขนาดอัตโนมัติได้ในสคริปต์ Terraform ของ Amazon Web Services หรือ Google Cloud

ผู้ปฏิบัติงานการรวมข้อมูลจะเรียกใช้บริการการบันทึกการใช้งานรายงานที่รวบรวมได้สําหรับการบันทึกการใช้งานรายงานที่รวบรวมได้ บริการนี้ช่วยให้มั่นใจได้ว่าระบบจะเรียกใช้งานก็ต่อเมื่อไม่เกินขีดจํากัดงบประมาณด้านความเป็นส่วนตัว (ดูกฎ"ไม่ซ้ำกัน") หากมีงบประมาณ ระบบจะสร้างรายงานสรุปโดยใช้ข้อมูลรวมที่มีสัญญาณรบกวน อ่านรายละเอียดเพิ่มเติมเกี่ยวกับการบัญชีรายงานแบบรวม

Aggregation Worker จะอัปเดตข้อมูลเมตาของงานในฐานข้อมูลข้อมูลเมตาของงาน ข้อมูลนี้รวมถึงรหัสผลลัพธ์ของงานและตัวนับข้อผิดพลาดของรายงานในกรณีที่รายงานบางส่วนไม่สำเร็จ ผู้ใช้สามารถดึงข้อมูลสถานะได้โดยใช้ getJob Job State Retrieval API

ดูคำอธิบายโดยละเอียดเพิ่มเติมเกี่ยวกับบริการรวมข้อมูลได้ที่คำอธิบายนี้

ขั้นตอนถัดไป

เมื่อทราบวิธีการทำงานของบริการรวบรวมข้อมูลแล้ว ให้ทําตามคู่มือการเริ่มต้นใช้งานเพื่อติดตั้งใช้งานอินสแตนซ์ของคุณเองผ่าน Google Cloud หรือ Amazon Web Services