Ori Ernst

Supervisé(e) par : Jackie Cheung
Université McGill

Résumé multi-documents hétérogènes : Comment résumer des documents implicitement liés

L’abondance croissante d’informations textuelles nécessite le développement de méthodes efficaces pour agréger et utiliser des données provenant de sources multiples. Alors que les approches traditionnelles des configurations multi-sources supposent la présence de collections prédéfinies de documents liés et redondants, la réalité est que les humains rencontrent souvent des ensembles de documents dépourvus d’un récit commun clair. Dans de tels cas, une étape préalable identifiant les relations entre les documents devient indispensable. Pour permettre la recherche dans ce domaine, nous proposons d’établir la tâche de « résumé multi-documents hétérogènes » accompagné d’un ensemble de données de synthèse multi-documents dédié où la relation entre les documents n’est pas claire. Nous publierons également un ensemble de données spécifique pour la tâche d’identification des relations entre les documents. La disponibilité de ces ensembles de données ainsi que de nouveaux modèles de base étendront la tâche de synthèse à un cadre plus réaliste.