Rôles et responsabilités
Saif M. Mohammad (Ph.D.) est chercheur scientifique principal au Conseil national de recherches du Canada (CNRC). Il est titulaire d’un doctorat en informatique de l’Université de Toronto. Avant de se joindre à l’équipe du CNRC, il a occupé le poste d’associé de recherches à l’Institute of Advanced Computer Studies de l’Université du Maryland, à College Park. Ses recherches sont axées sur la linguistique computationnelle et le traitement du langage naturel (TLN), plus particulièrement sur la sémantique lexicale, les émotions dans le langage, l’analyse des sentiments, la créativité computationnelle, la fidélité en TLN, la psycholinguistique et la visualisation de l’information. Il a publié plus de 80 articles scientifiques et ses écrits sont abondamment cités (environ 1 500 citations en 2018 seulement). De plus, il a participé à l’organisation de nombreux colloques, notamment à titre de président du Symposium Canada–Royaume-Uni sur l’éthique en IA, de coprésident de SemEval (plus importante plateforme d’évaluation sémantique), de coorganisateur du WASSA (atelier sur l’analyse des sentiments) et de président sectoriel pour les colloques de l’ACL, de la NAACL et de l’EMNLP (dans les domaines de l’analyse des sentiments et de la fidélité en TLN). Son équipe a mis au point un système d’analyse des sentiments qui s’est classé au premier rang lors de compétitions de tâches communes. Les outils qu’il a mis au point pour l’étude des relations entre les mots et les émotions, tel le lexique anglais des émotions du CNRC, sont largement utilisés pour analyser les affects dans les textes. Ses travaux ont suscité l’attention des médias et fait l’objet d’articles dans Time, SlashDot, LiveScience, io9, The Physics arXiv Blog, PC World et Popular Science.
Vous pouvez regarder la vidéo de son allocution à l’Alan Turing Institute (Londres, mars 2019), qui résume ses récents travaux.
Cliquez ici pour visiter la page des recherches de Saif M. Mohammad.
Études
Doctorat en informatique de l’Université de Toronto
Maîtrise en informatique de l’Université du Minnesota
Activités professionnelles / intérêts
2019
- Président sectoriel, Analyse des sentiments et extraction des arguments, EMNLP-IJCNLP 2019, Hong Kong
- Président sectoriel, Analyse des sentiments et extraction des arguments, ACL 2019, Florence, Italie
- Président sectoriel, Éthique, biais et fidélité, NAACL 2019, Minneapolis, Minnesota, É.-U.
- Président sectoriel, Sémantique dans les applications de TLN, *Sem-2019, Minneapolis, Minnesota, É.-U.
- Président, Symposium Canada–Royaume-Uni sur l’éthique en IA 2019, Ottawa, Canada
- Coprésident, SemEval 2019, Minneapolis, Minnesota, É.-U.
- Mentor, atelier de recherche à l’intention des étudiants, ACL 2019, Florence, Italie
- Mentor, atelier de recherche à l’intention des étudiants, NAACL 2019, Minneapolis, Minnesota, É.-U.
2018
- Coprésident, SemEval 2018, Nouvelle-Orléans, Louisiane, É.-U.
- Coorganisateur, WASSA 2018, Bruxelles, Belgique
- Mentor, atelier de recherche à l’intention des étudiants, NAACL 2018, Nouvelle-Orléans, Louisiane, É.-U.
- Mentor, atelier de recherche à l’intention des étudiants, ACL 2018, Melbourne, Australie.
2017
- Coprésident, SemEval 2017, Vancouver, Canada
- Coorganisateur, WASSA 2018, Copenhague, Danemark
- Président sectoriel, Extraction des sentiments et des opinions, ACL 2017, Vancouver, Canada
- Président sectoriel, Extraction des sentiments et des opinions, EMNLP 2017, Copenhague, Danemark
- Mentor, atelier de recherche à l’intention des étudiants, ACL 2017, Vancouver, Canada.
2016
- Président sectoriel, Extraction des sentiments et des opinions, EMNLP 2016, Austin, Texas, É.-U.
- Président, publicité, EMNLP 2016, Austin, Texas, É.-U.
2015
- Président sectoriel, Extraction des sentiments et des opinions, NAACL 2015, Denver, Colorado
- Président, publicité, NAACL 2015, Denver, Colorado
- Mentor, atelier de recherche à l’intention des étudiants, NAACL 2015, Denver, Colorado
2014, 2012, 2011
- Mentor, atelier de recherche à l’intention des étudiants, ACL 2014, NAACL 2012 et ACL 2011
De 2008 à aujourd’hui, quasi tous les ans
- Membre du comité des programmes de périodiques et colloques renommés en TLN, dont TACL, ACL, NAACL, EMNLP, CL, CI, NLE, JAIR, TSLP, IJCNLP, ICWSM et IJCAI.
Prix
Soumissions à des compétitions internationales de tâches communes
- AMIA, tâche commune pour la détection des effets indésirables d’un médicament dans les gazouillis, Washington, DC, É.-U., 2017
Tâche : Classement de gazouillis mentionnant l’effet indésirable de médicaments
Résultat : 1re place (9 équipes participantes)
- SemEval 2014, tâche 4 : Analyse des sentiments en fonction de caractéristiques, août 2014, Dublin, Irlande
Tâche : Déterminer les sentiments à l’égard de termes et de catégories décrivant une caractéristique précise d’un élément
Résultat : 1re place pour deux des trois sous-tâches (plus de 30 équipes participantes)
- SemEval 2014, tâche 9 : Analyse des sentiments sur Twitter, août 2014, Dublin, Irlande
Tâche : Déterminer les sentiments exprimés dans des gazouillis, messages textes et entrées de blogues
Résultat : 1re place pour cinq des dix sous-tâches (plus de 40 équipes participantes)
- SemEval 2013, tâche 2 : Analyse des sentiments sur Twitter, juin 2013, Atlanta, É.-U.
Tâche : Déterminer les sentiments exprimés dans des gazouillis et messages textes
Résultat : 1re place pour trois des quatre sous-tâches (plus de 40 équipes participantes)
Inventions et brevets
Création de plusieurs ensembles de données et lexiques largement utilisés en informatique, mais aussi dans d’autres domaines tels que la psychologie, les sciences humaines et la santé publique.
- Lexiques
Pour la liste complète des lexiques créés, cliquez ici.
- Ensembles de données étiquetés
- annotation des émotions dans des gazouillis (en anglais)
- lexique de l’expression des sentiments par locutions à polarité opposée (SCL-OPP) (en anglais)
- lexique de l’expression des sentiments associée aux négations, aux modes de verbe et aux adverbes (SCL-NMA) (en anglais)
- parenté sémantique de bigrammes (en anglais)
- lexiques arabes des sentiments
- émotions suscitées par les œuvres d’art (en anglais)
Pour la liste complète des ensembles de données, cliquez ici.
- Système d’analyse des sentiments du CNRC : s’est classé au 1er rang dans trois tâches communes : SemEval 2013, tâche 2 (Mohammad, Kiritchenko et Zhu, 2013); SemEval 2014, tâche 9 (Zhu, Kiritchenko et Mohammad, 2014); SemEval 2014, tâche 4 (Kiritchenko, Zhu et Mohammad, 2014). Plusieurs des éléments du système du CNRC ont aussi été intégrés à un système de détection des positions dont la performance a surpassé celle des soumissions des 19 équipes participantes à la tâche 6 de SemEval 2016 (Mohammad et coll., 2017).
Démonstrations de visualisation de l’information et de sonification de données
- TransProse : conversion de texte en musique. Hannah Davis et Saif M. Mohammad.
Un roman classique anglais est entré dans un système qui génère une musique reflétant le flux des émotions exprimées par le texte.
- Imagisaurus : visualisation interactive du thésaurus de Roget (en anglais)
Imagisaurus aide les utilisateurs à saisir rapidement la nature et la taille de la taxonomie du thésaurus. Imagisaurus permet aussi d’explorer les catégories d’affects du thésaurus.
- Lexichrome : catalogue interactif des associations mot-couleur à l’intention des chercheurs, des concepteurs et des rédacteurs. Chris Kim, Saif M. Mohammad et Christopher Colins.
Lexichrome est une application qui cartographie le lexique anglais des mots associés aux couleurs du CNRC sous forme de catalogue Web pouvant être exploré et analysé par les utilisateurs. Il permet aux visiteurs de visualiser la composition chromatique (associations aux couleurs) de textes entrés par l’utilisateur.
- Outil de visualisation interactive du lexique anglais des émotions du CNRC
Le lexique des mots associés aux émotions du CNRC est une liste de mots anglais associés à huit émotions fondamentales (colère, peur, anticipation, confiance, surprise, tristesse, joie et dégoût) et à deux types de sentiments (négatifs et positifs). Les annotations manuelles sont le résultat d’une externalisation ouverte.
- Outils de visualisation interactive de lexiques de l’expression des sentiments
L’expression des sentiments désigne l’association de sentiments précis à des unités lexicales comprenant plusieurs mots, telles des locutions ou phrases, en fonction de leurs composantes. Deux visualisations sont possibles : (1) exploration de l’expression des sentiments dans des locutions anglaises contenant au moins un terme positif et un terme négatif, p. ex., « happy accident » ou « best winter break »; (2) exploration de l’expression des sentiments dans des locutions anglaises en fonction des négations, des temps de verbe et des adverbes de degré utilisés.
- Outil de visualisation interactive de l’ensemble de données sur les positions (en anglais)
Visualisation d’un ensemble de données d’annotation manuelle de gazouillis en fonction de la position exprimée à l’égard d’une cible, de la cible d’opinion (opinion à l’égard de) et des sentiments (polarité).
Annotation de l’usage métaphorique et littéral des verbes sur WordNet associé à leur contenu émotif (en anglais)
Principales publications
La liste complète des publications de S. M. Mohammad est accessible sur Google Scholar. Ci-après quelques publications marquantes.
- The Natural Selection of Words: Finding the Features of Fitness. Peter D. Turney and Saif M. Mohammad. PLoS One, 14 (1): e0211512. January 2019.
- Obtaining Reliable Human Ratings of Valence, Arousal, and Dominance for 20,000 English Words. Saif M. Mohammad. In Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics, Melbourne, Australia, July 2018.
- Examining Gender and Race Bias in Two Hundred Sentiment Analysis Systems. Svetlana Kiritchenko and Saif M. Mohammad. In Proceedings of *Sem, New Orleans, LA, USA, June 2018.
- WikiArt Emotions: An Annotated Dataset of Emotions Evoked by Art. Saif M. Mohammad and Svetlana Kiritchenko. In Proceedings of the 11th Edition of the Language Resources and Evaluation Conference (LREC-2018), May 2018, Miyazaki, Japan.
- Crowdsourcing a Word-Emotion Association Lexicon, Saif Mohammad and Peter Turney, Computational Intelligence, 29 (3), 436-465, 2013.
- Using Nuances of Emotion to Identify Personality, Saif M. Mohammad and Svetlana Kiritchenko, In Proceedings of the ICWSM Workshop on Computational Personality Recognition, July 2013, Boston, USA.
- From Once Upon a Time to Happily Ever After: Tracking Emotions in Novels and Fairy Tales, Saif Mohammad, In Proceedings of the ACL 2011 Workshop on Language Technology for Cultural Heritage, Social Sciences, and Humanities (LaTeCH), June 2011, Portland, OR.
- Stance and Sentiment in Tweets. Saif M. Mohammad, Parinaz Sobhani, and Svetlana Kiritchenko. Special Section of the ACM Transactions on Internet Technology on Argumentation in Social Media, 2017, 17 (3).
- Sentiment Analysis: Detecting Valence, Emotions, and Other Affectual States from Text. Saif M. Mohammad, Emotion Measurement, 2016.
- How Translation Alters Sentiment. Saif M. Mohammad, Mohammad Salameh, and Svetlana Kiritchenko, Journal of Artificial Intelligence Research, 2016, Volume 55, pages 95-130.
- Sentiment Analysis of Short Informal Texts. Svetlana Kiritchenko, Xiaodan Zhu and Saif Mohammad. Journal of Artificial Intelligence Research, volume 50, pages 723-762, August 2014.
- Computing Word-Pair Antonymy, Saif Mohammad, Bonnie Dorr, and Graeme Hirst, In Proceedings of the Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning (EMNLP-2008), October 2008, Waikiki, Hawaii.
Expérience de travail antérieure
Avant de se joindre au CNRC, Saif Mohammad occupait le poste d’associé de recherches à l’Institute of Advanced Computer Studies de l’Université du Maryland, à College Park.
Liens supplémentaires
Participation à des réseaux de recherche
- ACL Anthology
- dblp
- Google Scholar (Saif)
(Google Scholar pages of NLP Researchers at NRC) - CNRC
- Research Gate
- Semantic Scholar
Cliquez ici pour visiter la page des recherches de Saif M. Mohammad.
