• Project’s main objective was to develop a methodology for solving planning problems involving time by using simple planning tools. During the project I studied the field of classical and temporal planning, learned the PDDL language which is used for describing planning problems and designed a method for solving temporal planning problems using classical planning solver written in python (Pyperplan).
    Categories:
  • In this project, we consider the Inverse Reinforcement Learning problem in Contextual Markov Decision Processes. Here, the reward of the environment depends on a hidden static parameter referred to as the context, i.e., each context defines an MDP. The agent does not observe the reward, but instead, is provided with expert demonstrations for different contexts. The goal of the agent is to learn a mapping from contexts to rewards that...
    Categories:
  • Visual navigation systems have become essential in nowadays autonomous systems, with deep learning algorithms being the state-of-the-art. In this project, we will work towards developing adversarial attacks on such algorithms. We aim for generating passive example attacks that, when injected to the scene being observed by the visual sensor, will cause the navigation algorithm to diverge from its trajectory. We will start from attacking a white-box algorithm and examine several...
    Categories:
  • Perceptually aligned gradients is a known phenomenon where strong adversarial attacks (epsilon=1) produce samples which greatly resemble samples from different classes. In this project, we wish to explore several questions, such as: When does this phenomenon reproduce? and why? Does it depend on different attacks and norm limitations? We wish to study the above questions, especially interesting are EPGD attacks as described in the second link. https://arxiv.org/pdf/1910.08640.pdf https://arxiv.org/pdf/1911.07198.pdf
    Categories:
  • Background: Deep reinforcement learning (DRL) methods such as the Deep Q-Network (DQN) have achieved state-of-the-art results in a variety of challenging, high-dimensional domains. One of the major problems in DRL is that the state and action spaces are large, and the task often becomes an exploration problem. While DRL methods are new, RL is a well established field. There exist various algorithms in the tabular case which ensure proper exploration and convergence to the...
    Categories:
  • Deep learning in general, and segmentation problems in particular, are the subject of much research done in the field of learning systems. The rising power of computers enables the implementation of complex networks containing thousands of variables in order to create optimal architecture for such problems. However, there are several approaches to dealing with segmentation problems, each of which has its own advantages and disadvantages. This project deals with a...
    Categories:
  • Robots are rapidly becoming central tools to many industries, from manufacturing through e-commerce and autonomous vehicles to medicine and healthcare. A major challenge to current robotic manipulators is grasping objects, especially when the object shapes or poses are unknown in advance. Recent advances in Deep Learning have allowed training powerful grasp predictors, suggesting where a robot should attempt to grasp an object. In this project, we will train an ensemble...
    Categories:
  • Extreme classification is a growing research area dealing with multi-class tasks with an extremely large number of classes. One new challenge arising in this setting is to perform inference in a reasonable time, namely quicker than common-practice multi-class algorithms which require linear time in the number of classes. Many recent studies in this area learn hierarchical classification models, which allow logarithmic inference time. In the project we propose a different...
    Categories:
  • Starcraft2 is a complex game where two (or more) players compete to collect resources, build armies, and overcome the opponent to win the game. One of the major complexities in Starcraft compared to other strategy games is the real-time aspect; units and building must be accurately controlled live on top of executing high-level strategies. Therefore, one promising direction is to utilize deep learning. Neural nets can encode previous experience in...
    Categories:
  • We present a novel and effective approach for video to video translation through generative adversarial networks. Given an input video of a person and a target video, our model generates a video of that same person mimicking the motion of the person in the target video. Our model can be used for various tasks, from ”teaching” someone to dance like a skilled dancer to the generation of realistic videos of...
    Categories:
  • במסגרת הפרויקט הסטודנטים יתכננו ויממשו מערכת לומדת אשר תתרגם קלט (תמונות/ענן-חלקיקים) לאוסף צורות פשוטות. תחילה, הרשת תבצע פירוק היררכי של האובייקט לתתי חלקים ומשם תפיק קירוב גיאומטרי לטובת ייצוג דחוס ותמציתי של הסצנה.
    Categories:
  • הפרויקט עוסק בבעיית אסטרטגיות תקיפה של קבוצת תוקפים של קבוצת מטרות, בנוכחות קבוצת מגנים, ומבוססת על עקרונות מתקדמים של למידת חיזוק של קבוצות. דוגמאות לכך הינם משחק אטארי .. בו קבוצת טילים תוקפת מטרות קרקע בנוכחות קבוצה של טילי מגן. דוגמא אחרת ואולי יותר מעניינת מדברת על קבוצה של שחקנים שצריכה להעביר קבוצה של כדורים לצד שני של המגרש בנוכחות קבוצה של מגנים (סוג של פוטבול אמריקאי..). עקרון התכנון והבקרה...
    Categories:
  • In this project we will learn to get the optimal playing policy in black jack using reinforcement learning. The project will require developing a simulator of the environment and running different RL algorithms such as Q-learning, UCB and DQN. Final results will be showing the ability to learn known results such as basic strategy and cards counting and in the latter stage results for some open questions in the field...
    Categories:
  • Recent advancements in deep generative modeling, and especially Generative Adversarial Networks (GANs), propose to replace the original input data with features from  a pre-trained network to allow a more stable training procedure and working in a low-data regime. The recent ProjectedGAN paper exhibited great results in generating new images when there is very low data available (e.g., images of Pokemons). In this project, we will investigate ways to improve this...
    Categories:
  • Recent advancements in deep generative modeling replace the continuous latent vector representation with discrete latent representations and show improved performance in generation of new data. Most of these models, such as VQ-VAQ, VQ-GAN and DreamerV2 (RL), are based on Variational Autoencoders (VAEs). In the VAE framework, the user must choose a prior that generates latent variables, and in the continuous version, a simple Gaussian prior is usually chosen. However, in...
    Categories:
  • Recent advancements in deep generative modeling replace the loss function with features extracted from pre-trained models for better generative capabilities. This is true for the various types of generative models, such as Variational Autoencoders (VAEs) and Generative Adversarial Networks (GANs). In this project, we will investigate the need for these pre-trained networks and try to replace them with a bootstrapped version of our generative model. The project may involve different...
    Categories:
  • במסגרת הפרוייקט הסטודנטים יצלמו תרחיש של מטרות נעות עם הסתרות. לדוגמא: אנשים הולכים / רכבים נוסעים/ שחיינים בים/  בעלי חיים נעים האובייקטים הנבחרים לעקיבת מחשב מדי פעם מוסתרים . יש לפתח עוקב שיבצע עקיבה אחר המטרות הנבחרות על ידי המשתמש תוך התמודדות עם הסתרות. העוקב יבוסס על רשתות עמוקות שעברו לימוד לזיהוי אנשים/רכבים/אובייקטים נבחרים עיבוד תמונה פרדיקטורים ולוגיקה מתאימה. הקלט לרשתות עמוקות אלה הינו התרחיש המצולם והפלט מהאלגוריתם הינו עקיבת...
    Categories:
  • RL problems are canonically implemented as a Markov Decision Process. The MDP defines the dynamics of the environment. Some of these dynamics are easy to see and understand while others less so. Visualizing certain attributes of the  domain can significantly impact user’s ability to understand and interpret an agent’s behavior. This project will aim to provide visualizations for some of the following attributes: 1.Agent Rewards – Built in rewards of...
    Categories:
  • The goal of active perception is to optimize confidence and cost by utilizing sensors intelligently. We aim to develop a RL-based agent that scans parts of an image, sends the output to a predictive model, and, based on the prediction and confidence of the predictive model, decides if more parts of the image need to be scanned
    Categories:
  • העולם סביבנו הינו גם רציף וגם בדיד – אנו יודעים את סדר הפעולות שאנו רוצים לעשות, להרים כדור, להניח כדור וכו׳, ובד בבד אנו מתכננים בעולם הרציף כיצד לבצע דברים – היכן להניח את הכדור, כמה מים למלא במיכל, לאיזו טמפרטורה לחמם את החדר וכו׳. בנוסף העולם סביבנו מורכב מתתי בעיות שעובדות במקביל, ולעיתים משפיעות אחת על השנייה ולעיתים לא – תזוזה של כיסא בחדר אחד משנה את מצב אותו...
    Categories:
  • לוח זמני רכבות הינו דבר אשר נקבע מראש על סמך מרחקים בין תחנות, מהירויות נסיעה, וכן השערות לגבי הגעת נוסעים לתחנות. בפועל המציאות שונה מהתכנון, מגיעים נוסעים בכמות שונה, ולכן זמן עצירה בתחנה הינו שונה מהתכנון. בנוסף יכולות להיות תקלות ורכבות עלולות להתקע ולקלקל את זמני ההגעה של הרכבות, כפי שכולם בוודאי חוו על בשרם. בפרויקט זה נמדל את התלויות בין רכבות שונות ותחנות שונות במרחב מפורק (factored representation) ונעשה...
    Categories:
  • תיק מניות הינו דבר אשר מצריך התערבות ואיזון שוטפים, כתלות בסוג התיק ובסיכון כך גם תדירות ההתערבות. בפרויקט זה נמדל תיק השקעות אשר מחזיק מדדים בסיכון גבוה, כך שנדרשת התערבות אך מכיוון ומדובר במדדים, תדירות ההתערבות לא ברורה (זה איננו מסחר יומי, ומצד שני לא איזון רבעוני). סוגיה נוספת הינה שככל שנעשות יותר קניות מבנה התיק משתנה (Lots), ולכן קבלת ההחלטות יכולה להיות שונה – מבנה מצב שונה ופעולות שונות....
    Categories:
  • רשת תחבורה הינה מודל המתאר את הזרימה של מכוניות בצמתים מרומזרים וכבשים בערים. בעולם של מרכזי ערים צפופים וריבוי מכוניות על הכבישים, הצורך לנתב בצורה חכמה רכבים ולמנוע פקקים הולך וגובר. בפרויקט זה נמדל רשת רמזורים, ונבקרה בצורה מבוזרת על מנת להיות מסוגלים להתמודד עם טופולוגיות שונות (גודל חיבוריות). הגישה בפרוייקט זה תהיה על סמך כלים של Multi agent reinforcement learning אשר מאפשרת לכל צומת להיות עצמאית כסוכן ברשת, אך...
    Categories:
  • תחום הבינה המלאכותית מכיל מספר תתי תחומים אשר כל אחד מהם טוען ליכולת להגיע לבינה מלאכותית כללית, אך כל אחד מהם נתקל בקשיים אופייניים. תחום תכנון המשימה, הינו תחום הכולל חישוב משימה מתחילה ועד סופה על כל רבדיה. לדוגמא שתי מכוניות אוטונומיות הצריכות לאסוף 3 נוסעים שונים ממיקומי התחלה שונים ליעדים שונים צריכות לדעת מי אוספת את מי – החלטה דיסקרטית; מתי – החלטה רציפה; סדר פעולות (רכב אחד אוסף...
    Categories:
  • Time series(TS) is one of the most common types of data, specifically, TS analyses play an important role in medical research. Unfortunately, time series in the medical domain tend to be missing and sparse, often leading to wrong results. While most algorithms take this into account, specific types of missing mechanisms, which are very common in medical data, are more difficult to attend to. In this project, we aim to...
    Categories:
  • גרפי אינפורמציה הדדית (mutual information) מייצגים את הקשר בין גדלים ביולוגיים שונים, לרוב גרפים אלו נלמדים מתוך המידע הנאסף מניסוי בודד וללא שימוש במידע חיצוני. גרפים אלו מהווים את אחת מאבני היסוד במחקר רפואי. האתגר בלמידת קשרים מתוך ניסוי בודד הוא שלשם בניית הקשר אנחנו מאבדים את האינפורמציה על הדגימה הבודדת(או החולה הבודד), ובכך מאבדים את היכולת לקבל מסקנות מותאמות לכל מטופל. בפרויקט זה נציע וננתח שיטות לחילוץ מסקנות ברמת...
    Categories: