פרופ'דונאלד ברגס מאונ' ניו סאות' וולש ADFA שואל באחד הפורומים של כריית נתונים, האם יש בעיות מהותיות ששולטות בתחום הזה ומהן -
Is there a number of preeminent issues in this field and if so what are they?
שאלה טובה!
הגיע הזמן לחזור לשאלות בסיסיות כאלה. יותר מדי שקענו בפרטים טכניים. לא יזיק לבדוק גם את הפילוסופיה של כריית נתונים, ולראות אם הגישה שלנו בכלל מכילה סיכוי לפתרון.
האם הבעיה של כריית נתונים היא אמנם חדשה בנוף הפתרונות שעליהם גודלנו? חדשה במה?
זו הזמנה להביע דיעות.
אתחיל בבחירה אישית, מבין הנושאים השולטים ב data mining, הנה שתי בעיות:
1. כיצד אפשר לחפש פתרון ללא מטרה מוגדרת?
– המיחד את DM היא דרישתו, למצוא קשרים חדשים וסמויים, כלומר למצוא דברים שאינם ידועים בתחילה, בזמן של קביעת המטרה/ות. כאן הקושי.
2. איך ניתן להגדיר clusters בצורה אופטימלית במרחב רב מימדי?
– זו שאלת הביצה והתרנגולת: אם יודעים מה הפרמטרים הרלוונטים, ידוע כיצד להגדיר קבוצות אופטימליות, ואם יודעים מה הקבוצות אפשר לגזור מהן בקלות את הפרמטרים; אך איך מתחילים בלי לדעת את שניהם...