Bootcamp : État actuel des agents

Partagez l'événement

La semaine de Bootcamp inaugure le semestre thématique d’IVADO sur les agents LLM autonomes. Conçu pour doter les personnes participantes de connaissances fondamentales et d’une expérience pratique, cet événement de quatre jours rassemble des chercheuses et chercheurs ainsi que des étudiantes et étudiants pour explorer les capacités principales, les risques et les conséquences dans le monde réel des systèmes d’IA agentiques.

Chaque jour se concentre sur un thème distinct :

  • Jour 1 : Génie logiciel – Codage des agents
  • Jour 2 : Utilisation de l’ordinateur – Navigation des agents
  • Jour 3 : Robotique et incarnation
  • Jour 4 : Interaction multi-agents / Interaction humaine dans la boucle

Cet événement prépare le terrain pour l’ensemble du semestre en combinant des conférences de pointe, des tutoriels pratiques et des discussions sur la recherche interdisciplinaire.

Participants et participantes

Yoav Artzi (Cornell University, arXiv), Glen Berseth (Université de Montréal, MILA), Joyce Chai (University of Michigan), Daniel Fried (Carnegie Mellon University), Natasha Jaques (University of Washington), Alexandre Lacoste (ServiceNow), Ofir Press (Princeton University), Siva Reddy (IVADO, Mila, McGill University), Yu Su (The Ohio State University), Alane Suhr (UC Berkeley), Xin Eric Wang (UCSB, Simular), Victor Zhong (University of Waterloo, Vector Institute).

Programme

MARDI 12 AOÛT 2025 | GÉNIE LOGICIEL – CODAGE DES AGENTS

8:45 – 9:00 : Accueil et café
9:00 – 9:15 : Mot de bienvenue
9:15 – 10:45 : State of the Art – Code Generation With and For Agents
Daniel Fried (Carnegie Mellon University)
10:45 – 11:00 : Pause-café
11:00 – 12:30 : Exposé de recherche & Discussion (Présentation à distance) – Towards Autonomous Language Model Systems
Ofir Press (Princeton University)
12:30 – 14:30 : Lunch (non fourni)
14:30 – 16:00 :  Tutoriel – Debug-Gym: Training Interactive Debugging Agents
Marc-Alexandre Côté + Alessandro Sordoni (Microsoft Research Montreal)
16:00 – 18:00 : 5@7 réseautage

MERCREDI 13 AOÛT 2025 | UTILISATION DE L’ORDINATEUR – NAVIGATION DES AGENTS

9:00 – 9:15 : Accueil et café
9:15 – 10:45 : State of the Art – The State of Web Agents
Siva Reddy (IVADO, Mila, McGill University)
10:45 – 11:00 : Pause-café
11:00 –  11:30 : Exposé de recherche 1 – Building and Evaluating Generalist Agents
Victor Zhong (University of Waterloo, Vector Institute)
11:30 –  12:00 : Exposé de recherche 2 – Building AI Agents that Use Computers Like a Human
Xin Eric Wang (UCSB)
12:00 – 12:30 : Discussion
12:30 – 14:30 : Lunch (non fourni)
14:30 – 16:30 : Tutoriel – How to Build and Evaluate Autonomous WebAgents
Alexandre Lacoste (ServiceNow)

JEUDI 14 AOÛT | ROBOTIQUE ET INCARNATION

9:00 – 9:15 : Accueil et café
9:15 – 10:45 : State of the Art – The State of the Art of Robotics
Liam Paull (IVADO, Université de Montréal, Mila)
10:45 – 11:00 : Pause-café
11:00 –  11:30 : Exposé de recherche 1 – Integrating Language and Embodiment: LLMs in Cognitive Robots
Joyce Chai (University of Michigan)
11:30 –  12:00 : Exposé de recherche 2 – Think Graphical, Act Local: Distributed Inference for Robot Perception and Planning
Jana Pavlasek (Polytechnique Montréal)
12:00 – 12:30 : Discussion
12:30 – 14:30 : Lunch (non fourni)
14:30 – 16:30 : Tutoriel – From Tokens to Actions: How to Build General Robot Policies
Glen Berseth (Université de Montréal)

 

VENDREDI 15 AOÛT | INTERACTION MULTI-AGENTS / INTERACTION HUMAINE DANS LA BOUCLE

9:00 – 9:30 : Accueil et café
9:30 – 11:00 : State of the Art – Challenges of and Approaches to Modeling and Learning in Multi-Agent Interactions
Alane Suhr (UC Berkeley)
10:45 – 11:00 : Pause-café
11:00 –  11:30 : Exposé de recherche 1 – Multi-Agent Reinforcement Learning (MARL) for LLMs
Natasha Jaques (University of Washington)
11:30 –  12:00 : Exposé de recherche 2 – Post-Training via Agent Interaction
Yoav Artzi (Cornell University)
12:00 – 12:30 : Discussion
12:30 – 14:30 : Lunch (non fourni)
14:30 – 16:30 : Tutoriel – On the Emergence of Cooperation in Multi-Agent Reinforcement Learning
Quentin Bertrand (Inria)
16:30 – 16 :45 : Mot de clôture