מעולם לא עלה על דעתי לכפור בדרישה למדגם מיצג לצורך ניתוח סטיסטי. הגעתי לזה בעקיפין.
תחילה היה זה ספק ביכולתנו ליצר מדגם מיצג בניתוח ביג דטה.
אחר כך התרחב הספק בשאלת אוביקטיביות הקלט לאור התערבותינו בבחירת מדגם בהתאם למטרת המבחן,
ולבסוף התברר לי שהאינדוקציה ממדגם לכלל האוכלוסיה היא, על פי המודל המדעי שקבע פרנציס ביקון במאה ה-16, לכל היותר צורה של העלאת השערות אך לא הוכחה לכלום.
אז איזה נתונים לקחת לניתוח? - נתונים שיכילו מגוון גדול ככל האפשר של טווח המשתנים. זה הכל. פשוט יותר מבחירת מדגם, ונכון יותר לצורך הפקת חוקי התנהגות.
אדית
Home of GT data mining