Les lexiques des émotions et des sentiments

Aperçu de l'outil

La collection des lexiques des sentiments et des émotions du CNRC compte sept ouvrages, dont le lexique des mots associés aux émotions, déjà bien implanté. Chacun de ces corpus comporte une liste de mots et de leurs associations à certaines catégories d'objets d'intérêt, tels que des émotions (la joie, la tristesse, la peur, etc.), des sentiments (positifs ou négatifs) ou des couleurs (rouge, bleu, noir, etc.). Tous ces lexiques renferment des entrées correspondant à des mots du vocabulaire anglais qui peuvent être utilisés directement pour analyser des textes dans cette langue. Le lexique des mots associés aux émotions du CNRC comporte en outre une fonction de traduction automatisée des entrées dans 40 autres langues cibles, dont le français, l'arabe, le chinois et l'espagnol.

Avantages pour les utilisateurs

Nous faisons appel aujourd'hui aux ordinateurs et aux algorithmes pour nous aider à décortiquer des masses phénoménales de données et comprendre l'information qu'elles recèlent, notamment en cherchant quels propos sont véhiculés au sujet d'une entité cible donnée (les entités cibles courantes incluent les entreprises, les produits, les politiques, des personnes et des États). Récemment, nous allons même plus loin et tentons de répondre à des questions plus ciblées comme : « Les mentions au sujet d'une entité cible sont-elles positives ou négatives? » et « Le locuteur est-il satisfait de la cible, en colère contre elle ou la craint-il? » Grâce à ses compétences de pointe en analyse de textes, le CNRC a établi des lexiques des émotions et des sentiments qui permettent de concevoir des logiciels d'analyse automatisée des sentiments, en fournissant une compréhension plus approfondie des sentiments et des émotions véhiculés dans l'information.

Les lexiques des sentiments et des émotions peuvent être utilisés pour:

  • améliorer les modèles de relations avec les clients;
  • identifier les déclencheurs d'émotions intenses chez les gens;
  • suivre l'évolution des sentiments envers les politiciens, des films, des produits;
  • détecter le sentiment de bien-être et de bonheur;
  • améliorer les systèmes de didacticiels et de traitement de dialogue automatiques;
  • détecter comment des mots et des métaphores chargés sont utilisés dans le discours pour persuader ou contraindre;
  • développer des personnages sensibles aux émotions dans les jeux d'ordinateur.

Public cible

Les lexiques des sentiments et des émotions s'adressent à des publics variés :

  • les entreprises qui souhaitent créer des produits commerciaux;
  • les chercheurs (linguistes informaticiens, linguistes, psychologues, analystes de données, etc.) qui étudient les émotions;
  • les organismes de recherche publics et autres qui travaillent à créer des produits pour le bien-être public.

Description des outils techniques

Liste des lexiques des sentiments et des émotions du CNRC inclus dans cette distribution :

Lexique Description Nombre de termes Association
Lexique des mots associés aux émotions du CNRC Listes d'associations de mots à huit émotions (la colère, la peur, l'anticipation, la confiance, la surprise, la tristesse, la joie et le dégout) et de deux sentiments (négatifs et positifs). Créées par annotations manuelles sur une plateforme de sociofinancement. Traductions automatiques dans 40 langues.

>14 000unigrammes (mots)

~25 000 sens

Binaire (associée ou non)
Lexique des mots associés aux mots-clics d'émotion du CNRC Listes d'associations de mots à huit émotions (la colère, la peur, l'anticipation, la confiance, la surprise, la tristesse, la joie et le dégout). Générées automatiquement à partir de gazouillis utilisant des mots-clics fondés sur des émotions telles que #happy et #anger (#heureux ou #colère). >16 000 unigrammes (mots) Valeur réelle
Lexique des mots associés aux mots-clics de sentiment du CNRC Listes d'associations de mots avec des sentiments, positifs ou négatifs. Générées automatiquement à partir de gazouillis utilisant des mots-clics évoquant des sentiments tels que #amazing et #terrible (#fantastique et #terrible).

>54 000 unigrammes

>316 000 bigrammes

>308 000 paires

Valeur réelle
Lexique des mots associés aux mots-clics de sentiment en contextes d'affirmation du CNRC et Lexique des mots associés aux mots-clics de sentiment en contextes de négation du CNRC Listes d'associations de mots avec des sentiments, positifs ou négatifs, dans des contextes d'affirmation ou de négation. Générées automatiquement à partir de gazouillis utilisant des mots-clics évoquant des sentiments tels que #amazing et #terrible (#fantastique et #terrible).

Contextes d'affirmation :

>36 000 unigrammes

>159 000 bigrammes

Contextes de négation :

>7 000 unigrammes

>23 000 bigrammes

Valeur réelle
Lexique des mots associés aux émoticônes de sentiment du CNRC Listes d'associations de mots avec des sentiments positifs (ou négatifs). Générées automatiquement à partir de gazouillis utilisant des émoticônes tels que :) et :(.

>62 000 unigrammes

>677 000 bigrammes

>480 000 paires

Valeur réelle
Lexique des mots associés aux émoticônes de sentiment en contextes d'affirmation et Lexique des mots associés aux émoticônes de sentiment en contextes de négation Listes d'associations de mots avec des sentiments positifs (ou négatifs) dans des contextes d'affirmation ou de négation. Générées automatiquement à partir de gazouillis utilisant des émoticônes tels que :) et :(.

Contextes d'affirmation :

>45 000 unigrammes

>240 000 bigrammes

Contextes de négation :

>9 000 unigrammes

>34 000 bigrammes

Valeur réelle
Lexique des mots associés aux couleurs du CNRC Listes d'associations de mots avec des couleurs dressées manuellement sur une plateforme de sociofinancement.

>14 000 unigrammes (mots)

~25 000 sens

Binaire (associée ou non)

Articles de recherche pertinents (disponibles seulement en anglais)

Configurations requises

Les lexiques sont distribués sous la forme de fichiers textuels qui fournissent des résultats d'émotion ou de sentiment pour un ensemble de mots. Ces fichiers textuels peuvent être lus avec n'importe quel éditeur de texte sur tout type de plate-forme.

Frais

Les lexiques sont accessibles gratuitement aux fins de la recherche. Ils sont également offerts pour des applications commerciales moyennant l'obtention d'une licence commerciale perpétuelle (qu'on peut acheter en un seul paiement d'une somme nominale, dans la boutique virtuelle du CNRC). Veuillez communiquer avec nous pour en savoir davantage.

Contactez-nous

Questions d'ordre technique

Saif M. Mohammad, agent de recherches principal
Téléphone : 613-993-0620
Courriel : Saif.Mohammad@nrc-cnrc.gc.ca

Questions d'ordre commercial

Pierre Charron, agent, Développement des affaires
Téléphone : 613-990-0336
Courriel : Pierre.Charron@nrc-cnrc.gc.ca