מדוע מתעלמים מהפיל שבחדר?
זו שאלה שיכולה להביא את המתבונן לכדי יאוש. איך יכול להיות שהמומחים לא מתיחסים לדבר המונח לפניהם באופן כל כך ברור. האם הם בכלל מומחים? האם נפלנו למלכודת פתאים שבה עושי-שוק מסבירים דבר אחד ועושים דבר אחר?
ובכן, לכשל הגדול מסתבר יש, בין היתר, שני מנגנונים פרוזאים לגמרי. האחד הוא, שעובדות חזקות ובולטות כמו פיל בחדר, הן לא חדשה תקשורתית, ואין כביכול מה לחפש בהן דבר מעבר למה שכבר גלוי לעין כל. המנגנון השני, הוא המהומה המפחידה שמעורר פיל בחדר - מהומה שגורמת לנוכחים לברוח בפאניקה מכל תזוזה של החיה הענקית.
דיון זה הוא פתיח לסדרה על המשבר הכלכלי העולמי שאנחנו בתוכו, ושאלת החיזוי וגם היכולת האישית להתכונן ולפעול נכון ולפעמים נגד הזרם.
אם כריית נתונים יכולה להאיר מקומות חשוכים שאנחנו לא מכירים, מענין יהיה להשתמש בה להנחיה בימים אלה.
הערה: הדיון ממשיךבמידה מסוימת את הדיון על "ה-BI של Lehman Brothers, Merrill Lynch, AIG" - הענקיות שנפלו בהפתעה במשבר 2008
ניתוח הנתונים אדיש למשתנים שהם קבועים בכל הרשומות (אינווריאנטים).
משתנים קבועים נחשבים לנתוני רקע בלתי מתערבים, היות ובתור קבועים אינם יכולים להסביר שינויים במערכת.
לדוגמא: במחקר התאידות מיים ממאגר שבוצע בעונה שבה הטמפרטורה כמעט ללא שינוי, הטמפרטורה האחידה לא תהיה יכולה להסביר את השינויים במידת התאידות המיים.
במשתנים שהם דומיננטיים, כמו "פיל בחדר", קשה להפיק מסקנות לגבי השפעתם על משתני המטרה, מאחר והשפעתם נרחבת, וכמעט אין תחומים אוביקטיביים שיכולים לשמש לבדיקה האם השפעתם אמנם אינה מתקימת שם כמצופה.
*מדע הנתונים החדש נבדל מסטטיסטיקה במטרה שלו שהיא ליצר השערות. ראה עקרונות מדע הנתונים סעיף 6. מטרה זו משחררת משחררת מחובת הנחות המודל הסטטיסטי ומאפשרת בכך להפיק מסקנות גם ממשתנים דומיננטים.