ריקוד גוגל

המונח "ריקוד גוגל" מתייחס לעדכוני מסדי הנתונים של גוגל. בעבר גוגל היה מבצע עדכונים מידע בממוצע של אחת לחודש, במהלך העדכונים הללו גוגל רשם אתרים חדשים במסד הנתונים שלו כמו גם עדכן את המידע לגבי אתרים ישנים ולגב והקישורים המוצגים כמיוחסים אל אתר.
במהלך אותם עדכונים היה ניתן לראות תנועות משמעותיות בתוצאות דפי החיפוש של ולכן באמצע שנת 2003 גוגל החל לבצע עדכונים באופן שוטף אך עדין, אחת לכמה זמן (לדוגמה לאחר שינוי משמעותית באלגוריתם עצמו) נעשה עדכון מסדי נתונים גורף אבל בשל העדכונים השוטפים השוני בין עדכון לעדכון אינו משמעותי כבעבר.

ישנה תפיסה מוטעת שטוענת כי גוגל יכול לשלוט בדרך בה שרתים מגיבים לעדכון אבל בשל אופי תהליך העדכון שליטה שכזו היא פשוט בלתי אפשרית, למעשה "הריקוד", כלומר תנועת תוצאות החיפוש כולן מושפעת מהאופן בו גוגל משתמש במערכת שמות דומיינים (DNS – Domain Name System )

לא רק שגוגל משתמש בלמעלה מ-10000 שרתים, שרתים אלו מפוזרים ב-13 חוות שרתים שונות בעולם (רובן בארה"ב ובאירלנד) בכדי שגוגל יוכל לכוון תנועה לכל אותן חוות שרתים הוא יוכל באופן תאורתי לתעד את החיפושים השוני באופן ריכוזי ורק לאחר מכן לשלוח אותם לכל המקומות הרלוונטיים, אבל זהו תהליך בעייתי ולא יעיל כיוון שלכל חוות שרתים יש כתובת IP ייחודית משלה המנוהלת ע"י המערכת לשמות דומיינים.
בבסיסו של דבר ה-DNS מספקת את הקישור בין דומיין נתון לכתובת ה-IP שלו, כשגולש מכניס כתובת דומיין לדפדפן שרת מקומי משיג לו את כתובת ה-IP המתאימה ע"י התחברות לשרת ה-DNS שאחראי לדומיין הזה.
המידע הרלוונטי לאותו דומיין יושב על השרת האחראי לפרק הזמן הנדרש בכדי "לפדות" אותו, זהן זמן החיות של דומיין (TLL). דף הבית של גוגל "חי" 5 דקות. בכל פעם שנוצר קשר עם שרת DNS הוא שולח חזרה את כתובת ה-IP של חוות שרתים אחת, בדרך זו שאלות חיפוש שמופנות לגוגל מאוזנות ע"י הפניה למקומות שונים הקרובים ביותר למקור החיפוש מה שמקצר את זמן פדיון הדומיין. מכאן שבמהלך "ריקוד גוגל" חוות השרתים לא מקבלות את העדכונים באותו זמן וכאשר משתמש מבקש מידע כלשהו בזמן זה ומתחבר לחוות השרתים הקרובה אליו הוא עלול לקבל מידע "לא מעודכן" לגבי שם דומיין מסוים

מבחינת המשתמש כל התהליך לא מורגש אך זהו תהליך מורכב בו שותפים השרתים של גוגל, חוות השרתים ומערכת שמות הדומיינים.