Analyse de textes

Les informations se multiplient de façon exponentielle, faisant en sorte que les professionnels aux prises avec des ensembles volumineux de données ont parfois du mal à ne pas se laisser dépasser. L'équipe d'analyse de textes du Conseil national de recherches du Canada (CNRC) imagine, crée et évalue des outils qui extraient des informations utiles de cette masse. Ces informations peuvent être explicites, implicites ou inférées; composites (résumées); de sous-texte (sentiment, sarcasme, métaphore); ou des méta-informations.

L'équipe collabore avec le gouvernement, l'industrie et les universités pour intégrer les techniques d'analyse de textes à une panoplie d'applications qu'alimentent les données ou les problèmes à résoudre. Elle a notamment fait des incursions dans des domaines comme la connaissance de la situation, l'informatique au service de la recherche clinique, l'analyse des sentiments et des émotions, et l'intelligence.

Ce que nous offrons

Intégrée au Centre de recherche en technologies numériques du CNRC, l'équipe offre ses compétences essentielles dans les domaines suivants :

  • Linguistique computationnelle
  • Visualisation des données
  • Apprentissage profond
  • Méta-analyse de documents
  • Analyse des émotions
  • Extraction de l'information
  • Récupération de l'information
  • Analyse du langage médical et biomédical
  • Réseaux neuronaux et apprentissage profond
  • Analyse des sentiments
  • Connaissance de la situation
  • Réduction des données
  • Analyse chronologique et détection d'évènements
  • Algorithmes d'apprentissage sans supervision

Concours internationaux et partage de tâches

  • Classement parmi les meilleurs pour l'extraction d'informations cliniques lors du défi i2b2 de traitement des textes cliniques en langage naturel de 2010, 2012 et 2017
  • Classement parmi les meilleurs et organisation de tâches multiples à l'atelier international SemEval Shared Tasks de 2012 à aujourd'hui

Logiciels et applications

Pourquoi travailler avec nous?

Nos spécialistes cumulent un vaste bagage de connaissances et d'expérience sur les méthodes d'analyse de textes les plus récentes. Ils savent comment et quand utiliser au mieux telle ou telle technique. Leurs talents vont des algorithmes statistiques les plus connus et les plus fiables aux approches d'avant-garde dans le domaine des réseaux neuronaux artificiels ou de l'apprentissage profond.

Notre capacité à innover et notre compétence technique en apprentissage machine, ainsi que dans les méthodes articulées sur les ensembles volumineux de données, ont donné lieu à des recherches qui ont été remarquées dans le monde. L'équipe a décroché la palme à maintes reprises lors des défis visant à extraire de l'information des textes scientifiques, notamment les épreuves i2b2 de traitement des données cliniques en langage naturel ou celles d'analyse des sentiments de SemEval.

Pour les entreprises et les organisations qui ont pour responsabilité une saine gestion et une exploitation rationnelle des données, la confiance de la population est primordiale. Notre équipe s'est engagée à faire preuve de la plus grande conscience professionnelle qui soit dans le développement et l'exploitation des technologies d'analyse de textes. Ses membres font régulièrement appel aux chefs de file dans ce domaine, afin qu'ils partagent leur savoir-faire avec les chercheurs et les auteurs de politiques, et l'équipe intègre des procédés éthiques d'évaluation à ses projets dès le départ, quand elle collabore avec ses partenaires.

Réseau mondial de renseignement de santé publique

Le Réseau mondial de renseignement de santé publique (RMISP) a son siège à l'Agence de la santé publique du Canada, à Ottawa. Ce réseau a été établi pour signaler rapidement les menaces potentielles pour la santé publique partout dans le monde, y compris les éclosions de grippe aviaire et de syndrome respiratoire aigu sévère (SRAS).

Entre 2016 et 2018, l'ASPC a confié au Conseil national de recherches du Canada (CNRC) le mandat de développer une nouvelle application logicielle d'analyse multilingue de textes pour le système utilisé par le RMISP. C'est ainsi que le CNRC a remplacé l'ancienne application logicielle du RMISP par une suite intégrée d'outils conforme aux spécifications.

Le CNRC assure l'entretien de l'application logicielle dans le cadre d'un accord de services techniques à long terme, mais il ne joue aucun rôle décisionnaire quant aux menaces pour la santé publique.

Pour en savoir plus sur le RMISP, visitez le site de l'Agence de la santé publique du Canada.