Sowmya Vajjala

Rôles et responsabilités

Je suis agente de recherches au sein de l’équipe Traitement multilingue de textes du Centre de recherche en technologies numériques (TN) du Conseil national de recherches Canada (CNRC). J’effectue principalement des recherches en traitement du langage naturel (TLN); j’ai aussi déjà travaillé à fournir des orientations de recherche à des entreprises canadiennes dans le cadre du Programme d’aide à la recherche industrielle (PARI). Je fais également du mentorat auprès d’étudiants inscrits à un programme coopératif.

Recherche et / ou projets en cours

– Reconnaissance de l’entité nommée

– Évaluation automatique de la lisibilité et simplification du texte

– Interface de recherche sur le TLN avec d’autres disciplines (éducation, évaluation du langage, économie, etc.)

Énoncés de recherches / projets

Je m’intéresse globalement à la recherche sur le TLN et à sa pertinence dans d’autres disciplines et en lien avec les pratiques de l’industrie. Mes intérêts de recherche actuels sont plus précisément liés à l’extraction de l’information et à la classification du texte, ainsi qu’à l’évaluation du rendement du TLN au-delà de la comparaison de divers modèles. Outre la recherche, j’aime aussi faire connaître le TLN à divers publics, notamment des étudiants et des chercheurs d’autres disciplines qui commencent à découvrir le TLN.

Études

Ph. D. en linguistique computationnelle, Université Eberhard Karls de Tübingen (Allemagne), 2015 (Summa Cum Laude).

Maîtrise ès science en informatique et en génie, International Institute of Information Technology, Hyderabad (Inde), 2009.

Baccalauréat en électronique et en ingénierie des communications, Université Osmania, Hyderabad (Inde), 2005.

Activités professionnelles / intérêts

-  [December 2022] « Beyond the state of the art models: What is complex text, and what are we simplifying? », conférencière invitée dans le cadre de l’atelier sur l’accessibilité, la lisibilité et la simplification du texte, lors de la Conference on Empirical Methods in Natural Language Processing (EMNLP) de 2022.

- « NLP Evaluation Beyond a standard test set », conférencière invitée à Gojek Tech, août 2022.

- « NLP without an annotated dataset », tutoriel de 90 minutes offert dans le cadre du Toronto Machine Learning Summit (2021) et de l’Open Data Science Conference (2021).

(Slides, Code and Other Materials)

- « NLP beyond NLPers: The many faces of NLP in academia and the real-world », Séance plénière dans le cadre de la 46e Conference of the Japan Association of English Corpus Studies (JAECS), 2020 (Diapositives)

Affiliations

Association for Computational Linguistics (ACL)

Association for Computing Machinery (ACM)

Principales publications

Practical Natural Language Processing: a comprehensive guide to building real-world nlp systems, ouvrage dont je suis la coauteure avec Bodhisattwa Majumder, Anuj Gupta et Harshit Surana, publié par O’Reilly Media en 2020.

La liste complète des publications est disponible ici : ‪Sowmya Vajjala – ‪Google Scholar

Expérience de travail antérieure

– 2018-2019 : Scientifique de données principale pour The Globe and Mail (Toronto) et AbacusNext (Toronto)

    * Mise sur pied d’équipes de scientifiques de données : embauche et mentorat

    * Élaboration de prototypes de recherche pour divers cas d’utilisation du TLN

    * Discussions avec divers intervenants pour recueillir des renseignements sur les exigences

    * Collaboration avec des équipes de développement et exploitation pour le déploiement d’applications

Expérience ou travail international

– Janvier 2016 à avril 2018 Professeure adjointe (poste menant à la permanence), Iowa State University (États-Unis)

   * Enseignement dans le domaine de la science des données, de la programmation, du traitement du langage naturel et des communications techniques

   * Mentorat auprès d’étudiants

   * Direction de recherches et rédaction de demandes de subventions

Sowmya Vajjala

Agent(e) de recherches associé(e)
Technologies numériques
1200, chemin de Montréal
Ottawa, Ontario K1A 0R6
Langue préférée : anglais
Autre(s) : anglais, télougou, hindi
Téléphone : 416-346-6517

Suivez-moi

Expertise

Technologie de l'information, Intelligence artificielle, Apprentissage automatique, Traitement du langage naturel, Science des données, Modélisation