Fermer×
Retour au Laboratoire

Étape 1. Introduction aux bases de l’IA pour une meilleure appropriation en enseignement

21 novembre 10 h à midi, sur Zoom

Le 21 novembre 2023 s’est tenue la 1re étape du Laboratoire Éductive « Plonger au cœur de l’IA pour développer de nouvelles pistes d’enseignement : une aventure collective ». 82 personnes ont pris part à cette rencontre qui avait pour but de démystifier certains concepts clés liés à l’IA et de permettre un approfondissement du fonctionnement des technologies d’IA pour ensuite, lors des prochaines étapes du laboratoire, être en mesure d’utiliser plus efficacement cette technologie en contexte d’enseignement.

Au cours de cette rencontre, 3 intervenants ont partagé leurs connaissances sur le sujet :

  • Syntyche Le Boedec, experte en science des données, a présenté le fonctionnement du réseau neuronal.
  • Carole Lailler, docteure en sciences du langage, a expliqué le traitement que réserve l’IA au texte et à la parole
  • Pierre Rosin, gestionnaire de projet en IA chez Jacobb, a présenté les éléments à considérer pour créer de bons prompts

Envie d’échanger avec les panélistes ? Rejoignez-nous sur la page Linkr du laboratoire!

Synthèse de la rencontre

Le réseau neuronal

Syntyche Le Boedec affirme qu’il est pertinent de s’intéresser au fonctionnement du réseau neuronal, car il permet de mieux comprendre le fonctionnement des IA génératives.

Les réseaux neuronaux sont associés à un ensemble de technologies appelé «apprentissage automatique» dans lequel une toute petite partie appartient à l’« apprentissage profond », catégorie à laquelle se rattache ChatGPT.

L’apprentissage automatique comporte plusieurs familles d’apprentissage :

  • l’apprentissage supervisé (classification d’images, détection de fraude à l’identité, prévisions météorologiques). L’apprentissage supervisé est un type d’apprentissage pour lequel le résultat final attendu est connu. Cette technologie repose sur le postulat qu’un historique de données et d’observations existe et est utilisé pour alimenter le système et déterminer les classes ou les caractéristiques de classification.
  • l’apprentissage non supervisé (ciblage marketing, système de recommandations). L’apprentissage non supervisé est un ensemble de données sans cible a priori. L’objectif de cette technologie est d’organiser un ensemble de données en fonction de différents paramètres définis. Les résultats ne sont pas connus d’avance.
  • l’apprentissage par renforcement (navigation robotique, apprentissage de tâches, décisions en temps réel). Il s’agit d’un apprentissage supervisé où le système se nourrit de nouvelles connaissances pendant la vie du modèle pour ainsi améliorer sa prise de décision.

L’apprentissage automatique s’appuie toujours sur des données, et ces données sont au réseau neuronal, ce que les stimulus sont aux neurones humains. Tout comme les neurones humains qui reçoivent de l’information, la traitent et la transmettent, les réseaux neuronaux en IA reçoivent des données, les traitent mathématiquement et produisent un résultat en fonction du traitement.

Lorsqu’on entraine un réseau neuronal, Syntyche Le Boedec explique qu’il faut anticiper certaines caractéristiques, leur donner une valeur et entrainer le modèle à attribuer le bon niveau d’importance (poids) aux différentes caractéristiques pour s’assurer que les résultats produits soient les plus justes possibles, comme c’est le cas, par exemple, avec un système d’apprentissage supervisé. Synthyche Le Boedec explique également que construire un modèle est un processus itératif. Il faut constamment nourrir le modèle avec de nouvelles données pour le mettre à jour. Cela permet d’éviter les biais et les erreurs et rend sa base de données riche et robuste.

Enfin, comprendre le fonctionnement du réseau de neurones nous permet de mieux comprendre les impacts qu’une base de données insuffisante ou biaisée peut occasionner sur les réponses générées par un modèle d’IA ainsi que l’importance d’entrainer les modèles avec des données de plus en plus diversifiées pour les perfectionner et les faire évoluer dans le temps.

Le modèle de langage

Carole Lailler aborde les modèles de langage dans les outils d’IA générative.

Les IA génératives qui utilisent des mots et des phrases comme données d’entrées (à la place d’images ou de nombres par exemple) ont un défi supplémentaire : comprendre la signification des mots. Le français, entre autres, est une langue morphosyntaxique où le contexte revêt une grande importance pour comprendre la signification des mots. Par exemple, le mot « mouton » peut être utilisé autant pour parler de l’animal dans le champ que du repas dans l’assiette. C’est uniquement l’analyse du contexte de la phrase qui permettra de discerner l’un de l’autre. Sans contexte, l’information donnée n’a pas nécessairement le même sens et peut donc entrainer un résultat erroné. Les Large Language Model (LLM) sur lesquels reposent les systèmes, tels ChatGPT, analysent une si grande quantité de données que les utilisations moins courantes de certains mots tendent à être omises et à disparaitre. Ainsi, des IA génératives créées dans des contextes précis et liés à des domaines spécifiques tendent à produire des résultats plus justes. Carole Lailler insiste également sur le fait que les systèmes comme ChatGPT agissent en repli lorsqu’ils n’arrivent pas à comprendre un mot ou une expression. Ils devinent ou proposent un mot pour compléter une phrase ou une expression, sans vérifier s’il s’agit d’une information erronée. Tous ces systèmes d’IA vont produire une réponse à une requête, que celle-ci soit bonne ou mauvaise.

Les prompts en IA générative

Finalement, Pierre Rosin présente comment l’information s’encode et se décode dans les réseaux de neurones des IA génératives. Entre l’étape d’encodage et celle de décodage, il y a une représentation latente où l’information est compressée en vecteurs. Par exemple, nous pourrions encoder du texte pour décoder, en guise de résultat, une image.

Pierre Rosin donne quelques conseils pour rédiger une bonne requête (prompt) avec un outil d’IA. Pour la plupart des modèles d’IA générative, des compétences en programmation ne sont plus nécessaires. Le code a été interfacé par du texte.

Le 1er élément à inclure dans une requête est la définition du rôle que jouera l’IA pour effectuer sa tâche. Par exemple, souhaitons-nous qu’elle prenne le rôle d’un enseignant ou d’un journaliste ? Ensuite, il faut préciser le contexte de la requête et, pour terminer, spécifier le format de la sortie.

Pour éviter qu’une requête tombe caduque, il faut affiner le modèle en l’entrainant avec différents prompts pour le forcer à répondre. Toutefois, comme Pierre Rosin le souligne, il y a un risque de dégénérescence des modèles. Plus les données qui nourrissent les modèles d’IA sont générées par ces mêmes modèles, l’IA oublie des pans de connaissances entrainant la perte de connaissances et un manque de diversité dans les réponses. Il est donc impératif que l’humain reste dans la boucle et soit présent pour valider les informations générées par l’IA.

Enregistrement de l’activité

S’abonner
Notification pour
guest

9 Commentaires
Le plus ancien
Le plus récent Le plus populaire
Commentaires en ligne
Afficher tous les commentaires
Stephane Alarie
Stephane Alarie
7 novembre 2023 10h36

Bonjour, considérant que le 21 novembre sera un jour grevé, cet évènement sera-t-il déplacé à une date ultérieure?

Dernière modification le 5 mois il y a par Stephane Alarie
Catherine Rhéaume
Catherine Rhéaume
8 novembre 2023 15h09
Répondre à  Stephane Alarie

Non, malheureusement, l’événement ne peut pas être déplacé. Cependant, il sera enregistré: vous pourrez en visionner les enregistrements et participer ensuite sans problèmes aux étapes 2 et 3 du laboratoire cet hiver!

Janie
Janie
15 novembre 2023 9h12

Bonjour,
Je suis dans l’impossibilité de participer le 21 novembre mais cette activité m’intéresse beaucoup. Comment fonctionner pour visionner l’enregistrement: je m’inscris et recevrai un lien par la suite pour pouvoir le visionner?
Merci!

janie

Camille Arpin
Camille Arpin
15 novembre 2023 9h38
Répondre à  Janie

Bonjour,
Quelques semaines après l’étape 1 du laboratoire, nous mettons en ligne un compte-rendu ainsi que l’enregistrement vidéo de l’activité directement sur la page de l’étape 1. Nous annoncerons la mise en ligne de l’enregistrement vidéo dans notre infolettre Éductive.
Bonne journée

Emilie B
Emilie B
17 novembre 2023 8h58

Bonjour, je travaille dans une université française. Cet atelier est-il ouvert à tous ?

Catherine Rhéaume
Catherine Rhéaume
17 novembre 2023 9h12
Répondre à  Emilie B

Oui, absolument! Inscrivez-vous!

Robert Vadeboncoeur
Robert Vadeboncoeur
22 novembre 2023 9h23

Bonjour, hier dans la présentation, vous avez dit que vous enregistriez la présentation. Une urgence syndicale m’a forcé à quitter la réunion avant la fin. Puis-je avoir l’hyperlien pour l’enregistrement ?
Merci

Camille Arpin
Camille Arpin
22 novembre 2023 10h43
Répondre à  Robert Vadeboncoeur

Bonjour M. Vadeboncoeur,
D’ici 2 semaines, une synthèse ainsi que l’enregistrement de l’activité seront accessibles sur la présente page de l’étape 1 du laboratoire Éductive. Le tout sera annoncé dans notre infolettre.

Robert Vadeboncoeur
Robert Vadeboncoeur
22 novembre 2023 12h08
Répondre à  Camille Arpin

Super, merci !