הצטרפו לקבוצות שלנו לקבלת עדכונים מרוכזים פעם בשבוע:

ווטסאפ:
http://wa.dwh.co.il
טלגרם:
http://telegram.dwh.co.il

חוק מס' 5 של מדע הנתונים החדש - מדגם לניתוח אמפירי

More
9 years 1 month ago #8412 by Edith Ohri
חוק מס' 5 כל נתון אותנטי הוא רלוונטי ללימוד ומבחן. מדגם יכסה כמה שיותר סוגי תופעות וערכי משתנים, כולל נקודות קצה וחריגים.

מבנה הנתונים הסופי הוא טבלאי: רשומות אירועים, ובכל רשומה משתנים שמתארים את האירוע.

למשתני הרשומות יש להוסיף את תיאור הסביבה, תיאור מקור הנתונים, והדלתא - השינוי של הרשומה ביחס לרשומות סמוכות (זאת כדי לשמר מידע שטמון במבנה וברצף האירועים).

אלגוריתם של חיפוש השערות חיב להכיל התראות על חוסר עקביות בנתונים המסכן את המסקנות, בכך שמאפשר מסקנות סותרות על בסיס אותו מדגם.

הערה: מודל מדע הנתונים החדש משחרר מחובת המדגם המיצג והאיכות האחידה של הרשומות (ניתן להוכיח מדוע זה אפשרי לפי חוקים 1-4). האפשרות מצמצמת בהרבה את דרישות האינטגרציה בנתונים (אחידות שלמות ואמינות) ותומכת בכך בלימוד מהיר של נתונים אותנטיים (כמו שהם).

13-05-2017
Home of GT data mining


בברכה
אדית

Please התחברות to join the conversation.

Moderators: Edith Ohri
Time to create page: 0.241 seconds