Topics API לאינטרנט

Topics API מאפשר לפרסם על סמך תחומי עניין בלי להשתמש בקובצי Cookie של צד שלישי.

איך Topics API פועל

אפשר להשתמש ב-Topics API כדי לבחון נושאים שנראים מעניינים למשתמש, על סמך הפעילות שלו, ולספק גישה אליהם. לאחר מכן, Topics API יכול לתת למפעילי API (כמו פלטפורמות של טכנולוגיות פרסום) גישה לתחומי העניין של המשתמש, בלי לחשוף מידע נוסף על הפעילות של המשתמש.

מושגים מרכזיים

  • נושא הוא נושא שמעניין את המשתמש הנוכחי וקריאה לאנשים. הוא חלק מהטקסונומיה של Topics.
  • מבצע קריאה הוא ישות, כמו אפליקציה, ערכת SDK של צד שלישי, אתר או שירות, ששולחת בקשה ל-Topics API כדי לצפות בתחומי העניין של משתמש או לגשת אליהם.
  • נושא נצפה על ידי מבצע הקריאה, אם מבצע הקריאה שלח בקשה ל-Topics API מדף אינטרנט או מאפליקציה שמשויכים לנושא הזה במהלך שלושת העידנים האחרונים.
  • תקופת זמן היא תקופה של חישוב נושאים, שמוגדרת כברירת מחדל לשבוע אחד.
  • טקסונומיה היא רשימה היררכית של קטגוריות, שכוללת, לדוגמה, קטגוריות כמו /Arts & Entertainment/Music & Audio/Soul & R&B ו-/Business & Industrial/Business Services/Corporate Events.
  • המערכת מסיקה את הנושאים באמצעות מודל סיווג שממפה את פעילות המשתמשים לאפס נושאים או יותר.

השלבים המרכזיים בתהליך של Topics API

מחזור החיים של Topics API כולל שלושה שלבים עיקריים:

  • לבחון את פעילות המשתמשים, למשל כשהם מבקרים בדף האינטרנט https://cats.example/tabby/index.html או מורידים את האפליקציה cats.
  • הסקת נושאים מפעילות המשתמשים, לדוגמה /Pets & Animals/Pets/Cats.
  • גישה לנושאים שנצפו בעבר אצל המשתמש, למשל כאות לבחירת פרסום רלוונטי (כמו קידום מכירות של מזון לחתולים).

מעקב אחר נושאים

מבצעי הקריאה יכולים לגשת רק לנושאי עניין שהם הבחינו בהם. מבצע הקריאה עוקב אחרי נושא כששולח בקשה ל-Topics API מהקשר שמשויך לנושא הזה. כדי להמחיש את העיקרון הזה, נבחן את הדוגמה הפשוטה הבאה.

  • נניח שיש שתי פונקציות קריאה חוזרת (caller) ל-Topics API: A ו-B.
  • יש שני הקשרים:
    • Greenhouse, לדוגמה אפליקציה בשם Greenhouse או אתר greenhouse.example, המשויכים לנושא Home & Garden.
    • תרגילי טניס, לדוגמה אפליקציה בשם 'תרגילי טניס' או אתר tennis.example, שמשויכים לנושא Sports/Tennis.
  • גם מבצע הקריאה החוזרת A וגם B נמצאים בהקשר של Greenhouse.
  • רק המתקשר B נמצא בהקשר של תרגילי טניס.
  • כדי לפשט את העניין, נניח שלא זוהו נושאים לגבי המשתמש לפני תקופת 1.
  • המשתמש מבקר באפליקציה Greenhouse, והגורמים A ו-B מבצעים קריאה ל-Topics API כדי לתעד את הביקור של המשתמש בדף או באפליקציה (כדי ללמוד איך לבצע קריאה ל-Topics API, אפשר לעיין במדריך להטמעה שמופיע בקטע השלבים הבאים). הרשומה הזו (שם מארח או נתוני אפליקציה) משמשת מאוחר יותר להסקת נושאים שמעניינים אתכם. בהמשך, Topics API יסמן את הנושא Home & Garden כנושא שנצפה על ידי שני מבצעי הקריאה A ו-B.
  • המשתמש נכנס לאפליקציה Tennis exercises. רק מבצע הקריאה החוזרת B שולח בקשה ל-Topics API. בהמשך, Topics API יסמן את הנושא Sports/Tennis כנושא שנצפה על ידי מבצע הקריאה B.
  • בסוף התקופה לקביעת נושאים, Topics API מרענן את הנושאים המובילים של המשתמש ומזהה את מבצעי הקריאה החוזרת שצפו בנושאים האלה על סמך פעילות המשתמש.
  • בהמשך, כשמבצע הקריאה B יבצע קריאה נוספת ל-Topics API, הוא יכול לקבל את הנושא Home & Garden או Sports/Tennis (או, עם סיכוי של 5%, נושא אקראי) עבור המשתמש הזה במערך התשובות.
  • למבצע הקריאה החוזרת A יש גישה רק לנושא Home & Garden, כי הוא אף פעם לא צפה בנושא Sports/Tennis. כלומר, צד שלישי ידע על תחום העניין של המשתמש רק בהקשר הספציפי (אפליקציה או אתר) שבו הוא מופיע.
תרשים שבו מוצג ש-Topics API מסמנים את הנושאים כנושאים שנצפו רק אם למבצעי הקריאה החוזרת יש נוכחות בהקשר.
Topics API מסמנים את הנושאים שנצפו רק על ידי מבצעי הקריאה שיש להם נוכחות בהקשר של הנושאים האלה. המשתתפים יוכלו לגשת רק לנושאים שהם צפו בהם.

הפקת נושאים

מערכת Topics מסיקה תחומי עניין מפעילות המשתמשים. הנושאים נבחרים מתוך טקסונומיה מוגדרת מראש בקוד פתוח. פעם בתקופה לקביעת נושאים, המערכת של Topics מרעננת את חמשת הנושאים המובילים של המשתמש ואת הגורמים שהציגו אותם במהלך התקופה. המודל המסווג של Topics API מסיק נושאים מפעילות המשתמשים: שם מארח לביקור בדף אינטרנט, פרטי האפליקציה ב-Android.

מבצע השיחה ניגש לתחומי העניין של המשתמש

ה-API מחזיר רק נושאים שהמבצע של הקריאה הבחין בהם במהלך שלושת הזמנים האחרונים. אפשר להחזיר לשולח הקריאה עד שלושה נושאים,נושא אחד לכל אחת משלוש תקופות הזמן האחרונות לקביעת נושאים (אם לשולח הקריאה נצפו נושאים באותה תקופה). מבצע הקריאה החוזרת יכול להשתמש בנושאים שמוחזרים כדי להשלים מידע הקשרי, ואפשר לשלב אותם כדי למצוא מודעה רלוונטית יותר למשתמש.

תקופות

Topics API צריך לוודא שהנושאים שמעניינים את המשתמשים יהיו מעודכנים. המערכת מסיקה את הנושאים של המשתמש על סמך הפעילות שלו במהלך תקופה שנקראת 'תקופת זמן לקביעת נושאים'. התקופה הזו היא שבוע כברירת מחדל. לכל משתמש יש תקופות ייחודיות (התקופות הן 'לכל משתמש') ושעת ההתחלה הראשונית נקבעת באופן אקראי.

בכל תקופת זמן לקביעת נושאים, Topics API מחשב את חמשת הנושאים המובילים של המשתמש ומזהה את מבצעי הקריאה החוזרת שצפו בנושאים האלה באמצעות מידע במכשיר. בכל תקופת זמן לקביעת נושאים ייבחר נושא אחד באופן אקראי מתוך חמשת הנושאים המובילים של המשתמש באותה תקופה. כדי לשפר עוד יותר את הפרטיות ולהבטיח שכל הנושאים יוצגו, יש 5% סיכוי שהנושא ייבחר באופן אקראי מתוך כל הנושאים האפשריים בטקסונומיה של תחומי העניין.

נושאים באינטרנט – איך זה עובד בפועל

באינטרנט, המערכת מסיקה את הנושאים משמות המארחים של הדפים שבהם המשתמש מבקר. לדוגמה, הנושא שהמערכת מסיקה לאתר dogs.example יכול להיות /חיות מחמד ובעלי חיים/חיות מחמד/כלבים.

בתרשים הבא מוצגת דוגמה פשוטה שממחישה איך Topics API יכול לעזור לפלטפורמת טכנולוגיית פרסום לבחור מודעה מתאימה. בדוגמה הזו, נניח שכבר יש בדפדפן של המשתמש מודל למיפוי שמות המארחים של אתרים לנושאים.

תרשים שבו מוצגים השלבים במחזור החיים של Topics API, מהרגע שבו משתמש מבקר באתרים ועד להצגת מודעה.
בתרשים של מחזור החיים של Topics API מפורטים השלבים של פעולות ה-API מנקודת מבט כללית.

הדפדפן קובע את המקור של מבצע הקריאה על סמך ההקשר של הקוד שמפעיל את Topics API. בפועל, המשמעות היא שמשתמשי Topics קוראים ל-API ב-iframe מהמקור שלהם, או שהם כוללים נושאים באחזור למקור שלהם.

לדוגמה, אפשר להטמיע פלטפורמה לספקים (SSP) בכמה אתרים של בעלי תוכן דיגיטלי. לאחר מכן, פלטפורמת ה-SSP יכולה לשלוח קריאה ל-Topics API בתוך iframe מהמקור שלה, וכך לבחון נושאים שמשויכים למשתמש באתרים האלה. לאחר מכן, אפשר לשתף את הנושאים האלה עם פלטפורמה למפרסמים (DSP) כדי לעזור לה לבחור מודעה רלוונטית למשתמש.

איך ה-API קובע אילו מבצעי קריאה יראו אילו נושאים

גורמים שמפעילים את ה-API מקבלים רק נושאים שהם'ראו' לאחרונה, והנושאים של המשתמש מתעדכנים פעם בכל תקופת זמן לקביעת נושאים: תקופה מסוימת, שמוגדרת לשבוע אחד בהטמעה של Chrome. כלומר, ה-API מספק חלון נע שבו מבצע קריאה מסוים יכול לקבל נושאים שנצפו.

בטבלה הבאה מופיעה דוגמה (קטנה באופן לא מציאותי) להיסטוריית גלישה היפותטית של משתמש במהלך תקופה אחת. בטבלה מוצגים הנושאים שמשויכים לאתרים שבהם המשתמש ביקר, וגורמי הקריאה ל-API שנמצאים בכל אתר (הישויות שמפעילות את document.browsingTopics() בקוד JavaScript שכלול באתר).

אתר נושאים גורמים שמפעילים קריאות ל-API באתר
running.example Running & Walking
Athletic Shoes
adtech1.example
adtech2.example
dogs.example Dogs adtech1.example
holiday.example Hotels & Accommodations adtech2.example
sunglasses.example Sunglasses [none]

בסוף התקופה (שבוע אחד כברירת מחדל), Topics API יוצר את הנושאים המובילים של הדפדפן בשבוע.

  • כעת, adtech1.example עומד בדרישות לקבלת הנושאים Running & Walking,‏ Athletic Shoes ו-Dogs, כי הם זוהו בדומיין running.example וגם בדומיין dogs.example.
  • הדומיין adtech1.example לא עומד בדרישות לקבלת הנושא Hotels & Accommodations למשתמש הזה, כי הוא לא מופיע באף אחד מהאתרים שבהם המשתמש ביקר לאחרונה ושמשויכים לנושא הזה.
  • הדומיין adtech2.example ראה את הנושאים Running & Walking, ‏ Athletic Shoes ו-Hotels & Accommodations, אבל לא ראה את הנושא Dogs.

המשתמש ביקר באתר sunglasses.example, שכולל את הנושא Sunglasses, אבל לא היו קריאות ל-Topics API באתר הזה. בשלב הזה, המשמעות היא שה-API לא יחזיר את הנושא Sunglasses לכל מבצע קריאה.

בשבוע השני, המשתמש מבקר באתר אחר:

אתר נושאים גורמים שמפעילים קריאות ל-API באתר
cameras.example Camera & Photo Equipment adtech2.example

בנוסף, קוד מ-adtech2.example מתווסף אל sunglasses.example:

אתר נושאים גורמים שמפעילים קריאות ל-API באתר
sunglasses.example Sunglasses adtech2.example

בנוסף לנושאים Running & Walking, ‏ Athletic Shoes ו-Hotels & Accommodations משבוע 1, המשמעות היא ש-adtech2.example יוכל עכשיו לקבל את הנושאים Camera & Photo Equipment ו-Sunglasses – אבל רק החל מהעידן הבא, שבוע 3. כך צדדים שלישיים לא יכולים ללמוד יותר על ההיסטוריה של המשתמש (במקרה הזה, עניין באופנה) מאשר הם יכולים ללמוד באמצעות קובצי cookie.

אחרי שבועיים נוספים, יכול להיות שהנושאים Running & Walking, ‏ Athletic Shoes ו-Hotels & Accommodations יוצאו מרשימת הנושאים שעומדים בדרישות של adtech2.example אם המשתמש לא יבקר באתרים שכוללים את הנושאים האלה וגם את הקוד מ-adtech2.example.

השלבים שבהם Topics API פועל כשמשתמשים מבקרים באתרים שמשתמשים ב-API.
איך ה-API מזהה נושאים וגישה אליהם.

מודל מסווג

התכונה 'נושאים' משתמשת במודל סיווג שממפה שמות מארח של אתרים לנושא אחד או יותר (ניתוח מידע נוסף, כמו כתובות URL מלאות או תוכן דפים, עשוי לאפשר הצגת מודעות רלוונטיות יותר, אבל גם לפגוע בפרטיות).

טקסונומיה

הנושאים נבחרים מטקסונומיה. הנושאים האלה נבחרו על ידי צוות Chrome, במטרה שהטקסונומיה תהפוך למשאב שמנוהל על ידי שותפים מהימנים בסביבה העסקית. הטקסונומיה צריכה להיות קטנה מספיק כדי שדפדפנים של משתמשים רבים ישויכו לכל נושא. המטרה הסופית היא שהטקסונומיה תגיע מגורם חיצוני, שיכלול משוב ורעיונות מגורמים שונים בתחום.

כדי להימנע מקטגוריות רגישות, הנושאים צריכים להיות גלויים לכולם, להיבחר על ידי אנשים ולהישאר מעודכנים. הטקסונומיה שבה משתמש Chrome נוצרה על ידי אנשים כדי להחריג קטגוריות שנחשבות רגישות, כמו מוצא אתני או נטייה מינית.

סיווג של Topics

הנושאים נבחרים באופן ידני ל-50,000 האתרים המובילים, והרשימה הזו של שמות המארחים והנושאים שמוגדרים כברירת מחדל משמשת לאימון מודל הסיווג. לגבי האתרים המובילים, הגישה לנושאים מתבצעת מרשימת ההחרגות ולא באמצעות מודל הסיווג. אפשר להציג את רשימת ההחרגות באופן מקומי במחשב.

הדף chrome://topics-internals עם חלונית המסווג שנבחרה.
בחלונית Classifier בדף chrome://topics-internals מפורטים גרסת המודל, הנתיב שלו והנושאים שמשויכים לכל מארח שמופיע ברשימה.

ההטמעה של Topics API ב-Chrome מאפשרת להוריד קובץ TensorFlow Lite שמייצג את המודל, כדי שניתן יהיה להשתמש בו באופן מקומי במכשיר של המשתמש.

איך נבחרים חמשת הנושאים המובילים של המשתמש

ה-API מחזיר נושא אחד לכל תקופת זמן לקביעת נושאים, עד שלושה נושאים לכל היותר. אם מוצגים שלושה נושאים, הם כוללים נושאים מהעידן הנוכחי ושני העידנים הקודמים.

  1. בסוף כל תקופת זמן, הדפדפן אוסף רשימה של דפים שעומדים בקריטריונים הבאים:
    • המשתמש ביקר בדף במהלך התקופה.
    • הדף כולל קוד שמפעיל את document.browsingTopics().
    • ממשק ה-API הופעל (לדוגמה, לא נחסם על ידי המשתמש או על ידי כותרת תגובה).
  2. הדפדפן, במכשיר של המשתמש, משתמש במודל הסיווג שסופק על ידי Topics API כדי למפות את שם המארח של כל דף לרשימה של נושאים.
  3. הדפדפן יוצר רשימה של חמשת הנושאים המובילים.

    • כל אחד מ-22 נושאי הבסיס בטקסונומיה מוקצה לקטגוריה של 'תועלת גבוהה' או 'תועלת רגילה' על סמך משוב מסביבת הפרסום. הדפדפן ממיין את הנושאים לפי הקצאת הקטגוריה שלהם. כל נושאי הצאצאים יורשים את הקצאת הקטגוריה של נושא ההורה ברמה הבסיסית. נושאים בקטגוריה 'שימושיות גבוהה' מקבלים עדיפות גבוהה.
    • לאחר מכן, הדפדפן ממיין את הנושאים לפי תדירות בכל קטגוריה.
    • חמשת הנושאים המובילים מהרשימה הממוינת הזו נבחרים כנושאים המובילים של המשתמש באותה תקופה.

לאחר מכן, ה-method‏ document.browsingTopics() מחזיר נושא אקראי מתוך חמשת הנושאים המובילים בכל תקופת זמן לקביעת נושאים, עם סיכוי של 5% שכל אחד מהם יבחר באופן אקראי מתוך הטקסונומיה המלאה של הנושאים. ב-Chrome, המשתמשים יכולים גם להסיר נושאים ספציפיים או לנקות את היסטוריית הגלישה כדי לצמצם את מספר הנושאים שמוחזרים על ידי ה-API. המשתמשים יכולים גם לבטל את ההסכמה לשימוש ב-API.

אפשר לראות מידע על נושאים שנצפו במהלך האפוקליפסה הנוכחית בדף chrome://topics-internals.

השלבים הבאים

הכנת הסביבה לבדיקה ולפיתוח של אפליקציות אינטרנט באמצעות Topics API.
כדאי לעיין בפרטים על ההטמעה ובדוגמאות הקוד כדי שמבצעי הקריאה יוכלו לצפות בנושאים ולגשת אליהם.

ראה גם

כדאי לעיין במקורות המידע שלנו כדי להבין טוב יותר את Topics API באינטרנט.