บริการรวมข้อมูลช่วยให้เทคโนโลยีโฆษณามีข้อมูลเชิงลึกด้านประสิทธิภาพที่จําเป็นในการปรับปรุงประสิทธิภาพแคมเปญกับลูกค้า
เอกสารนี้ครอบคลุม
- คําศัพท์และแนวคิดสําคัญ
- วิธีการทํางานของบริการรวมข้อมูลเพื่อแสดงข้อมูล Conversion และเมตริกการเข้าถึงโดยละเอียดจากรายงานดิบแบบรวมได้
- ภาพรวมแนวคิดของการรวมรายงานที่รวบรวมได้
- ภาพรวมแนวคิดของคอมโพเนนต์ระบบคลาวด์
เอกสารนี้มีไว้สำหรับใคร
หน้านี้ช่วยให้เทคโนโลยีโฆษณาและนักพัฒนาซอฟต์แวร์เข้าใจวิธีที่ API ของเราช่วยให้การวัดผลโฆษณาที่มีประสิทธิภาพและรักษาความเป็นส่วนตัวได้
เอกสารนี้ถือว่าคุณคุ้นเคยกับ Private Aggregation API, Attribution Reporting API, Protected Audience API, Shared Storage และ Trusted Execution Environment
คําศัพท์และแนวคิดสําคัญ
ทำความคุ้นเคยกับคําศัพท์สําคัญต่อไปนี้ก่อนดําเนินการต่อ
อภิธานศัพท์
- เทคโนโลยีโฆษณา
-
แพลตฟอร์มโฆษณาคือบริษัทที่ให้บริการแสดงโฆษณา
- รายงานที่รวมได้
-
รายงานที่รวบรวมได้คือรายงานที่เข้ารหัสซึ่งส่งจากอุปกรณ์ของผู้ใช้แต่ละราย รายงานเหล่านี้มีข้อมูลเกี่ยวกับพฤติกรรมของผู้ใช้และ Conversion ข้ามเว็บไซต์ ผู้ลงโฆษณาหรือเทคโนโลยีโฆษณาจะกําหนด Conversion (บางครั้งเรียกว่าเหตุการณ์ทริกเกอร์การระบุแหล่งที่มา) และเมตริกที่เกี่ยวข้อง แต่ละรายงานได้รับการเข้ารหัสเพื่อป้องกันไม่ให้บุคคลต่างๆ เข้าถึงข้อมูลพื้นฐาน
- การบัญชีรายงานที่รวบรวมได้
-
บัญชีแยกประเภทแบบกระจายที่อยู่ในผู้ประสานงานทั้ง 2 ราย ซึ่งติดตามงบประมาณความเป็นส่วนตัวที่จัดสรรและบังคับใช้กฎ "ไม่ซ้ำกัน" นี่เป็นกลไกการคุ้มครองความเป็นส่วนตัวที่ทำงานภายในผู้ประสานงาน ซึ่งช่วยให้มั่นใจว่าไม่มีรายงานใดส่งผ่านบริการรวบรวมข้อมูลเกินงบประมาณความเป็นส่วนตัวที่กำหนดไว้
อ่านเพิ่มเติมเกี่ยวกับความสัมพันธ์ระหว่างกลยุทธ์การแบ่งกลุ่มกับรายงานที่รวบรวมได้
- งบประมาณการบัญชีของรายงานที่รวบรวมได้
-
การอ้างอิงงบประมาณที่ช่วยให้มั่นใจว่าระบบจะไม่ประมวลผลรายงานแต่ละรายการมากกว่า 1 ครั้ง
- บริการรวมข้อมูล
-
บริการที่ดำเนินการโดยเทคโนโลยีโฆษณาซึ่งประมวลผลรายงานที่รวบรวมได้เพื่อสร้างรายงานสรุป
อ่านข้อมูลเพิ่มเติมเกี่ยวกับเบื้องหลังของบริการรวบรวมข้อมูลได้ในคำอธิบายและรายการข้อกำหนดฉบับเต็ม
- การรับรอง
-
กลไกในการตรวจสอบสิทธิ์ข้อมูลระบุตัวตนของซอฟต์แวร์ โดยปกติจะใช้แฮชการเข้ารหัสหรือลายเซ็น สำหรับการเสนอบริการรวบรวมข้อมูล การรับรองจะจับคู่โค้ดที่ทำงานในบริการรวบรวมข้อมูลที่คุณดำเนินการโดยเทคโนโลยีโฆษณากับโค้ดโอเพนซอร์ส
- การเชื่อมโยงการมีส่วนร่วม
- ผู้ประสานงาน
-
หน่วยงานที่รับผิดชอบการจัดการคีย์และการบัญชีรายงานที่รวบรวมได้ ผู้ประสานงานจะดูแลรักษารายการแฮชของการกำหนดค่าบริการรวบรวมข้อมูลที่อนุมัติและกำหนดค่าการเข้าถึงคีย์การถอดรหัส
- เสียงรบกวนและการปรับขนาด
-
ข้อมูลรบกวนทางสถิติที่เพิ่มลงในรายงานสรุประหว่างกระบวนการรวบรวมเพื่อรักษาความเป็นส่วนตัวและตรวจสอบว่ารายงานสุดท้ายให้ข้อมูลการวัดผลโดยไม่ระบุตัวบุคคล
อ่านเพิ่มเติมเกี่ยวกับกลไกการเพิ่มสัญญาณรบกวนซึ่งดึงมาจากการแจกแจง Laplace
- ที่มาของการรายงาน
-
บุคคลที่รับรายงานที่รวบรวมได้ กล่าวคือ คุณหรือเทคโนโลยีโฆษณาที่เรียกใช้ Attribution Reporting API ระบบจะส่งรายงานที่รวบรวมได้จากอุปกรณ์ของผู้ใช้ไปยัง URL ที่รู้จักกันดีซึ่งเชื่อมโยงกับต้นทางการรายงาน ต้นทางการรายงานจะกําหนดในระหว่างการลงทะเบียน
- รหัสที่แชร์
-
ค่าที่คำนวณแล้วซึ่งประกอบด้วย
shared_info
,reporting_origin
,destination_site
(สําหรับ Attribution Reporting API เท่านั้น),source_registration-time
(สําหรับ Attribution Reporting API เท่านั้น),scheduled_report_time
และเวอร์ชันรายงานหลายรายการที่ใช้แอตทริบิวต์เดียวกันในช่อง
shared_info
ควรมีรหัสที่แชร์เดียวกัน รหัสที่แชร์มีบทบาทสําคัญในบัญชีรายงานที่รวบรวมได้ - รายงานสรุป
-
ประเภทรายงาน Attribution Reporting API และ Private Aggregation API รายงานสรุปจะรวมข้อมูลผู้ใช้แบบรวม และอาจมีข้อมูล Conversion โดยละเอียดที่มีการเพิ่มสัญญาณรบกวน รายงานสรุปประกอบด้วยรายงานสรุป รายงานเหล่านี้มีความยืดหยุ่นมากขึ้นและมีโมเดลข้อมูลที่สมบูรณ์กว่าการรายงานระดับเหตุการณ์ โดยเฉพาะสําหรับกรณีการใช้งานบางรายการ เช่น มูลค่า Conversion
- สภาพแวดล้อมการดำเนินการที่เชื่อถือได้ (TEE)
-
การกําหนดค่าฮาร์ดแวร์และซอฟต์แวร์คอมพิวเตอร์ที่ปลอดภัยซึ่งช่วยให้บุคคลภายนอกตรวจสอบเวอร์ชันที่แน่นอนของซอฟต์แวร์ที่ทํางานบนเครื่องได้โดยไม่ต้องกลัวว่าข้อมูลจะรั่วไหล TEE อนุญาตให้บุคคลภายนอกตรวจสอบได้ว่าซอฟต์แวร์ทํางานตามที่ผู้ผลิตซอฟต์แวร์กล่าวอ้างไว้ทุกประการ
ดูข้อมูลเพิ่มเติมเกี่ยวกับ TEE ที่ใช้สำหรับข้อเสนอ Privacy Sandbox ได้ที่คำอธิบายบริการ Protected Audience API และคำอธิบายบริการรวบรวมข้อมูล
เวิร์กโฟลว์ของบริการรวมข้อมูล
บริการรวบรวมข้อมูลจะสร้างรายงานสรุปของข้อมูล Conversion และข้อมูลการเข้าถึงแบบละเอียดจากรายงานดิบแบบรวมได้ ขั้นตอนการสร้างรายงานประกอบด้วยขั้นตอนต่อไปนี้
- เบราว์เซอร์จะดึงข้อมูลคีย์สาธารณะเพื่อสร้างรายงานที่เข้ารหัส
- ระบบจะส่งรายงานแบบรวมที่เข้ารหัสไปยังเซิร์ฟเวอร์เทคโนโลยีโฆษณา
- เซิร์ฟเวอร์เทคโนโลยีโฆษณาจะจัดกลุ่มรายงาน (ในรูปแบบ avro) และส่งไปยังบริการรวมข้อมูล
- Aggregation Worker จะดึงข้อมูลรายงานแบบรวมเพื่อถอดรหัส
- เวิร์กเกอร์การรวมข้อมูลจะดึงข้อมูลคีย์การถอดรหัสจากผู้ประสานงาน
- Aggregation Worker จะถอดรหัสรายงานเพื่อรวบรวมข้อมูลและเพิ่มสัญญาณรบกวน
- บริการบัญชีรายงานแบบรวมได้จะตรวจสอบว่ามีงบประมาณด้านความเป็นส่วนตัวเพียงพอที่จะสร้างรายงานสรุปสําหรับรายงานแบบรวมได้หรือไม่
- บริการรวมข้อมูลจะส่งรายงานสรุปขั้นสุดท้าย
แผนภาพต่อไปนี้แสดงการทํางานของบริการรวมข้อมูล ตั้งแต่เวลาที่รับรายงานจากเว็บและอุปกรณ์เคลื่อนที่ ไปจนถึงเวลาที่บริการรวมข้อมูลสร้างรายงานสรุป

กล่าวโดยสรุปคือ Attribution Reporting API หรือ Private Aggregation API จะสร้างรายงานจากอินสแตนซ์เบราว์เซอร์หลายรายการ Chrome จะได้รับคีย์สาธารณะซึ่งเปลี่ยนทุก 7 วันจากบริการโฮสติ้งคีย์ใน Coordinator เพื่อเข้ารหัสรายงานก่อนที่จะส่งไปยังแหล่งที่มาของการรายงานเทคโนโลยีโฆษณา แหล่งที่มาของการรายงานเทคโนโลยีโฆษณาจะรวบรวมและแปลงรายงานขาเข้าเป็นรูปแบบ avro และส่งไปยังบริการรวมข้อมูล เมื่อส่งคําขอกลุ่มไปยังบริการรวมข้อมูล บริการดังกล่าวจะดึงข้อมูลคีย์การถอดรหัสจากบริการโฮสติ้งคีย์ ถอดรหัสรายงาน และรวบรวมและเพิ่มสัญญาณรบกวนเพื่อสร้างรายงานสรุป ตราบใดที่มีงบประมาณความเป็นส่วนตัวเพียงพอที่จะสร้างรายงาน
ดูข้อมูลเพิ่มเติมเกี่ยวกับวิธีเตรียมรายงานที่รวบรวมข้อมูลได้ในส่วนการติดตั้งใช้งาน
การรวมรายงานที่รวมได้
ขั้นตอนการรายงานจะไม่สมบูรณ์หากไม่มีความช่วยเหลือจากเซิร์ฟเวอร์ต้นทางการรายงานที่กําหนด ซึ่งคุณระบุไว้ในระหว่างกระบวนการลงทะเบียน ต้นทางการรายงานมีหน้าที่รับผิดชอบในการรวบรวม เปลี่ยนรูปแบบ และจัดกลุ่มรายงานที่รวมได้ รวมถึงเตรียมรายงานเพื่อส่งไปยังบริการรวมข้อมูลใน Google Cloud หรือ Amazon Web Services อ่านเพิ่มเติมเกี่ยวกับวิธีเตรียมรายงานที่รวบรวมได้
คอมโพเนนต์ระบบคลาวด์
บริการรวมข้อมูลประกอบด้วยคอมโพเนนต์บริการระบบคลาวด์หลายรายการ คุณใช้สคริปต์ Terraform ที่ให้มาเพื่อจัดสรรและกําหนดค่าคอมโพเนนต์บริการระบบคลาวด์ที่จําเป็นทั้งหมด

บริการ Frontend
บริการระบบคลาวด์ที่มีการจัดการ: Cloud Function (Google Cloud) / API Gateway (Amazon Web Services)
บริการส่วนหน้าคือเกตเวย์แบบเซิร์ฟเวอร์เสมือนที่เป็นจุดแรกเข้าหลักสำหรับการเรียกใช้ Aggregation API เพื่อสร้างงานและดึงข้อมูลสถานะงาน โดยมีหน้าที่รับผิดชอบในการรับคําขอจากผู้ใช้บริการรวมข้อมูล ตรวจสอบพารามิเตอร์อินพุต และเริ่มกระบวนการกําหนดเวลาการทํางานของการเก็บรวบรวมข้อมูล
บริการส่วนหน้ามี API 2 รายการ ได้แก่
ปลายทาง | คำอธิบาย |
---|---|
createJob |
API นี้จะทริกเกอร์งานบริการรวมข้อมูล ในการเรียกใช้งาน จะต้องมีข้อมูล เช่น รหัสงาน รายละเอียดพื้นที่เก็บข้อมูลอินพุต รายละเอียดพื้นที่เก็บข้อมูลเอาต์พุต และต้นทางการรายงาน |
getJob |
API นี้จะแสดงสถานะของงานที่ระบุรหัสงาน ซึ่งจะแสดงข้อมูลเกี่ยวกับสถานะของงาน เช่น "ได้รับแล้ว" "อยู่ระหว่างดำเนินการ" หรือ "เสร็จสิ้นแล้ว" หากงานเสร็จสิ้นแล้ว ระบบจะแสดงผลลัพธ์ของงาน รวมถึงข้อความแสดงข้อผิดพลาดที่พบระหว่างการดำเนินการของงานด้วย |
โปรดดูเอกสารประกอบของ Aggregation Service API
คิวงาน
บริการระบบคลาวด์ที่มีการจัดการ: Pub/Sub (Google Cloud) / Amazon SQS (Amazon Web Services)
คิวงานคือคิวข้อความที่มีคําของานสําหรับบริการรวมข้อมูล บริการส่วนหน้าจะแทรกคําของานลงในคิว จากนั้นผู้ปฏิบัติงานการรวมข้อมูลจะดึงข้อมูลดังกล่าวไปใช้ประมวลผล
Cloud Storage
บริการระบบคลาวด์ที่มีการจัดการ: Google Cloud Storage (Google Cloud) / Amazon S3 (Amazon Web Services)
ไฟล์อินพุตและเอาต์พุตที่บริการรวบรวมข้อมูลใช้ เช่น ไฟล์รายงานที่เข้ารหัสและรายงานสรุปเอาต์พุต จะจัดเก็บไว้ในพื้นที่เก็บข้อมูลระบบคลาวด์
ฐานข้อมูลข้อมูลเมตาของงาน
บริการระบบคลาวด์ที่มีการจัดการ: Spanner (Google Cloud) / DynamoDB (Amazon Web Services)
ฐานข้อมูลข้อมูลเมตาของงานใช้เพื่อจัดเก็บและติดตามสถานะงานรวม โดยจะบันทึกข้อมูลเมตา เช่น เวลาสร้าง เวลาขอ เวลาอัปเดต และสถานะ เช่น ได้รับ อยู่ระหว่างดำเนินการ หรือเสร็จสิ้น Aggregation Worker จะอัปเดตฐานข้อมูลข้อมูลเมตาของงานเมื่องานดำเนินการ
ผู้ปฏิบัติงานการรวมข้อมูล
บริการระบบคลาวด์ที่มีการจัดการ: Compute Engine ที่มีพื้นที่ทำงานที่ปลอดภัย (Google Cloud) / Amazon Web Services EC2 ที่มี Nitro Enclave (Amazon Web Services)
เวิร์กเกอร์การรวมจะประมวลผลคําของานในคิวงาน และถอดรหัสอินพุตที่เข้ารหัสโดยใช้คีย์ที่ดึงมาจากบริการสร้างและแจกจ่ายคีย์ (KGDS) ในผู้ประสานงาน ผู้ปฏิบัติงานการรวมข้อมูลจะแคชคีย์การถอดรหัสไว้เป็นเวลา 8 ชั่วโมงและใช้คีย์ดังกล่าวกับงานที่ประมวลผล
Aggregation Worker ทํางานภายในอินสแตนซ์ Trusted Execution Environment (TEE) ผู้ปฏิบัติงานจะจัดการงานได้ครั้งละ 1 งานเท่านั้น คุณสามารถกำหนดค่าผู้ปฏิบัติงานหลายรายให้ประมวลผลงานพร้อมกันได้โดยการตั้งค่าการปรับขนาดอัตโนมัติ หากใช้ การปรับขนาดอัตโนมัติจะปรับจำนวนผู้ปฏิบัติงานตามจำนวนข้อความในคิวงาน คุณสามารถกําหนดค่าจํานวนผู้ทํางานขั้นต่ำและสูงสุดสําหรับการปรับขนาดอัตโนมัติผ่านไฟล์สภาพแวดล้อม Terraform ดูข้อมูลเพิ่มเติมเกี่ยวกับการปรับขนาดอัตโนมัติได้ในสคริปต์ Terraform ของ Amazon Web Services หรือ Google Cloud
ผู้ปฏิบัติงานการรวมข้อมูลจะเรียกใช้บริการการบันทึกการใช้งานรายงานที่รวบรวมได้สําหรับการบันทึกการใช้งานรายงานที่รวบรวมได้ บริการนี้ช่วยให้มั่นใจได้ว่าระบบจะเรียกใช้งานก็ต่อเมื่อไม่เกินขีดจํากัดงบประมาณด้านความเป็นส่วนตัว (ดูกฎ"ไม่ซ้ำกัน") หากมีงบประมาณ ระบบจะสร้างรายงานสรุปโดยใช้ข้อมูลรวมที่มีสัญญาณรบกวน อ่านรายละเอียดเพิ่มเติมเกี่ยวกับการบัญชีรายงานแบบรวม
Aggregation Worker จะอัปเดตข้อมูลเมตาของงานในฐานข้อมูลข้อมูลเมตาของงาน ข้อมูลนี้รวมถึงรหัสผลลัพธ์ของงานและตัวนับข้อผิดพลาดของรายงานในกรณีที่รายงานบางส่วนไม่สำเร็จ ผู้ใช้สามารถดึงข้อมูลสถานะได้โดยใช้ getJob
Job State Retrieval API
ดูคำอธิบายโดยละเอียดเพิ่มเติมเกี่ยวกับบริการรวมข้อมูลได้ที่คำอธิบายนี้
ขั้นตอนถัดไป
เมื่อทราบวิธีการทำงานของบริการรวบรวมข้อมูลแล้ว ให้ทําตามคู่มือการเริ่มต้นใช้งานเพื่อติดตั้งใช้งานอินสแตนซ์ของคุณเองผ่าน Google Cloud หรือ Amazon Web Services