תוכן הקורס ומטרתו
דמיינו חוקר שרוצה לבדוק השערה מסויימת. החוקר אסף נתונים, בדק את ההשערה שלו וגילה (נניח) שהיא לא נכונה. האם החוקר יכול לבחון השערה נוספת בעזרת אותו מאגר הנתונים שאסף? האם החוקר יכול לבחור את ההשערה החדשה על סמך הנתונים עצמם? שיטות קלאסיות להבטחת הנכונות של הממצאים מגבילות מאוד את היכולת של חוקרים לגשת בצורה אדאפטיבית לנתונים שאספו. הסכנה היא שגישה אדאפטיבית כזאת לנתונים תוביל ל overfitting ותגרום לכך שהחוקר "יגלה" תופעות "נכונות" עבור הנתונים הספציפיים שהוא אסף, אבל לא נכונות באוכלוסייה הכללית. האם אפשר מצד אחד לאפשר גישה אדאפטיבית לנתונים ומצד שני להבטיח את נכונות הממצאים? בקורס זה נבחן את השאלה הזאת מנקודת מבט תיאורטית.
נושאי ההרצאות:
* מבוא ורקע
* אורך ייצוג
* תנאי יציבות
* פרטיות דפרנציאלית
* סכימות דיחסה
* תוצאות אי-אפשרות
* נושאים נוספים בהתאם לשיקול המרצה
לסילבוס המפורט