Profils d'évaluation : apprenez à l'IA comment vous notez
Définissez votre philosophie de notation une seule fois et EvalIA l'applique dès la création du barème, puis à chaque correction. Ton, pondération des critères, tolérance aux variantes : vos copies sont corrigées selon vos standards.
Chaque enseignant a sa propre façon de noter. Certains valorisent avant tout la rigueur du vocabulaire scientifique. D'autres accordent plus de poids à la démarche qu'au résultat. Certains acceptent les synonymes, d'autres exigent le terme exact du programme.
Ces choix ne sont pas anecdotiques. La recherche en docimologie le montre depuis près d'un siècle : lors de l'expérience Carnegie (1932-1934), 100 copies de baccalauréat soumises à des groupes de correcteurs indépendants ont reçu des notes dont l'écart maximal atteint 13 points sur 20 en français et 9 points en mathématiques. Aucune copie n'a reçu deux fois la même note (Piéron & Laugier, 1934). Plus récemment, une étude expérimentale de Schmidt et al. (2023) a confirmé que l'effet de halo biaise significativement la notation : la performance perçue dans une matière influence la note attribuée dans une autre, même à copie identique (Schmidt et al., 2023).
Autrement dit, la variabilité de notation n'est pas un défaut de compétence. C'est une propriété structurelle de l'évaluation humaine. La solution n'est pas de supprimer le jugement de l'enseignant, mais de le rendre explicite, stable et reproductible.
C'est exactement ce que font les profils d'évaluation d'EvalIA. Et comme le montre notre analyse de la difficulté intrinsèque de la correction, ce besoin d'explicitation est confirmé par plus d'un siècle de recherche.
Le barème, clé de voûte de la correction
Avant de parler de correction, il faut parler de barème. Un barème bien construit est la condition préalable à toute correction de qualité : c'est lui qui définit ce qui est attendu, ce qui est valorisé, ce qui est toléré. Sans barème explicite, la correction repose sur une appréciation subjective qui varie d'une copie à l'autre, d'un jour à l'autre.
C'est pourquoi les profils d'évaluation interviennent dès la génération du barème, et pas seulement au moment de la correction. Quand vous sélectionnez un profil avant de créer un barème, l'IA intègre immédiatement votre philosophie de notation dans la structure même du barème : les critères retenus, leur pondération, le niveau d'exigence attendu pour chaque compétence. Le barème généré reflète votre approche pédagogique, pas une approche générique.
Ce barème personnalisé est ensuite utilisé comme référentiel pour chaque copie du lot. La chaîne est cohérente de bout en bout : le profil façonne le barème, le barème guide la correction, la correction produit une note et un retour alignés avec vos attentes.
Ce que contient un profil d'évaluation
Un profil regroupe trois dimensions fondamentales de votre approche de notation.
Le ton de notation
Trois options : strict, équilibré ou bienveillant.
Un ton strict applique les critères sans concession : une réponse incomplète est sanctionnée, une formulation imprécise est relevée. Un ton bienveillant valorise l'effort et le raisonnement même imparfait : l'élève qui a compris le principe mais s'est trompé dans l'application sera encouragé plutôt que pénalisé.
Le ton équilibré se situe entre les deux. C'est le comportement par défaut d'EvalIA quand aucun profil n'est sélectionné.
La pondération des critères
Sept axes d'évaluation sont disponibles, chacun réglable sur cinq niveaux d'importance (ignoré, faible, normal, important, critique) :
- Vocabulaire disciplinaire : l'élève utilise-t-il les termes exacts du programme ?
- Démarche et méthode : le raisonnement est-il structuré et rigoureux ?
- Qualité de la rédaction : les phrases sont-elles claires et bien construites ?
- Schémas et représentations : les schémas sont-ils corrects, légendés, exploitables ?
- Exactitude du contenu : les faits et les données sont-ils justes ?
- Argumentation et esprit critique : l'élève justifie-t-il ses réponses ?
- Originalité et dépassement : l'élève va-t-il au-delà de ce qui est attendu ?
Ce réglage fin s'appuie sur un constat bien documenté : une méta-analyse de 75 études empiriques (Jonsson & Svingby, 2007) a montré que les grilles d'évaluation analytiques et spécifiques améliorent significativement la fiabilité de la notation, là où les grilles génériques n'ont qu'un effet limité (Jonsson & Svingby, 2007). En ajustant les curseurs, vous construisez une grille qui reflète vos priorités disciplinaires.
La tolérance aux variantes
Trois niveaux : stricte, modérée ou souple.
La tolérance détermine comment l'IA réagit face aux synonymes, aux formulations alternatives et aux réponses partiellement correctes. En mode strict, seul le terme exact est accepté. En mode souple, un synonyme correct ou une formulation approchée sera accepté si le sens est préservé.
Ce réglage est particulièrement utile en sciences, où la frontière entre le vocabulaire courant et le vocabulaire disciplinaire est parfois floue. « Se reproduire » et « se multiplier » sont-ils équivalents en SVT ? Cela dépend du contexte, du niveau, et de votre exigence.
Des consignes spécifiques en complément
Au-delà des réglages structurés, chaque profil peut inclure des consignes personnalisées en texte libre (500 caractères maximum) et jusqu'à cinq critères d'évaluation supplémentaires.
Quelques exemples de consignes :
- « Ne pas pénaliser l'orthographe pour les élèves allophones »
- « Valoriser les exemples tirés de l'actualité scientifique »
- « Accepter les réponses rédigées en anglais pour la section européenne »
- « Les schémas doivent obligatoirement comporter un titre et une légende »
Ces consignes sont encadrées côté serveur (validation, détection d'injection, échappement HTML) pour garantir qu'elles influencent la correction sans compromettre la sécurité du système.
Comment ça fonctionne concrètement
Création du profil
Rendez-vous dans Paramètres, section « Profils d'évaluation ». Vous y créez un profil en quelques clics : un nom, une discipline, vos réglages. Vous pouvez créer jusqu'à 20 profils.
Par exemple : « 3e SVT bienveillant » pour les évaluations formatives, « Tle SVT exigeant » pour les devoirs de baccalauréat, « PC collège méthode » pour un devoir centré sur la démarche expérimentale.
Du barème à la correction : une chaîne cohérente
Le profil d'évaluation intervient à chaque étape du processus :
- Génération du barème : votre profil définit les critères, leur pondération et le niveau d'exigence. Le barème produit est aligné avec votre philosophie de notation dès sa création.
- Analyse de la copie : la correction s'appuie sur le barème personnalisé et applique votre ton et vos exigences à chaque copie du lot.
- Amélioration du barème : quand vous demandez à l'IA de perfectionner un barème existant, les suggestions tiennent compte de vos préférences.
Quand vous sélectionnez un profil avant de créer un barème, puis corrigez un lot de copies avec ce barème, toute la chaîne est cohérente : les mêmes critères, les mêmes pondérations, le même ton, de la première copie à la dernière.
Traçabilité
Chaque barème sauvegardé conserve la référence du profil utilisé. Vous pouvez ainsi retrouver quel profil a servi pour une évaluation donnée, ce qui facilite la transparence vis-à-vis des élèves et des parents.
Quelle différence avec les profils d'adaptation ?
EvalIA proposait déjà des profils d'adaptation pour les élèves en situation de handicap (PAP, PPS). Ces deux types de profils répondent à des besoins distincts :
Les profils d'adaptation modifient la forme de l'évaluation : mise en page aérée, consignes simplifiées, traduction, temps supplémentaire. Ils concernent l'accessibilité.
Les profils d'évaluation modifient la philosophie de notation : rigueur, critères, tolérance. Ils concernent l'approche pédagogique de l'enseignant.
Les deux peuvent se combiner : vous pouvez corriger une copie avec un profil d'adaptation (pour la forme) et un profil d'évaluation (pour le fond).
Pourquoi rendre sa philosophie de notation explicite
La conférence de consensus du CNESCO sur l'évaluation en classe (2022) a formulé des recommandations claires : définir des critères clairs et limités, éliminer les éléments de comparaison entre élèves, et fournir un retour sur les réponses et les stratégies utilisées plutôt qu'un jugement de valeur sur l'élève (CNESCO, 2022).
Une méta-analyse récente de Panadero et al. (2023) portant sur 21 études confirme que les grilles critériées produisent un effet positif modéré sur la performance académique (g = 0.45), tout en favorisant l'autorégulation et le sentiment d'auto-efficacité des élèves (Panadero et al., 2023). Les élèves qui comprennent les critères sur lesquels ils sont évalués progressent davantage.
Le Guide de l'évaluation des apprentissages publié par Éduscol rappelle que les établissements doivent formaliser un projet d'évaluation garantissant l'harmonisation des méthodes et la valeur certificative des notes. Les profils d'évaluation d'EvalIA formalisent cette exigence au niveau individuel : en définissant vos standards une fois pour toutes, vous garantissez que chaque copie d'un même lot est évaluée selon les mêmes critères, avec la même rigueur.
L'IA au service de l'enseignant, pas à sa place
Comme le rappelle la CNIL dans sa FAQ sur l'utilisation de l'IA en milieu scolaire (2025), l'enseignant ne doit pas déléguer son pouvoir d'évaluation et de décision à un outil IA. L'IA peut assister la correction et la préparation d'exercices adaptés, mais la décision finale reste humaine.
Les profils d'évaluation d'EvalIA s'inscrivent pleinement dans ce cadre : c'est l'enseignant qui définit les critères, les pondérations, le ton. L'IA les applique avec constance. L'enseignant reste maître de sa pédagogie ; l'IA lui évite l'effet de fatigue à la trentième copie du lot.
Pour les enseignants travaillant en équipe disciplinaire, chacun peut créer ses propres profils sans impacter ceux des collègues. Cela permet de respecter la liberté pédagogique de chacun tout en rendant les choix de notation explicites et reproductibles.
Pour aller plus loin
- Recommandations du jury, Conférence de consensus sur l'évaluation — CNESCO, 2022
- Guide de l'évaluation des apprentissages au lycée — Éduscol, 2023
- Effects of Rubrics on Academic Performance: a Meta-analytic Review — Panadero et al., 2023
- Enseignant : comment utiliser un système d'IA — CNIL, 2025
- Orientations pour l'IA générative dans l'éducation — UNESCO, 2023
- Mémento Docimologie : les principaux biais et effets — Académie de Grenoble, 2025
Pour comprendre le parcours complet d'une copie dans EvalIA (de l'OCR à la correction), consultez notre article : Comment l'IA évalue vos copies en détail.
Vos copies méritent d'être corrigées selon vos standards. Créez votre premier profil d'évaluation et laissez EvalIA noter comme vous.