DEFT 2020 : guide d'annotation

Date de mise-à-jour : 20 mars 2020.

L'édition 2020 du défi fouille de textes (DEFT) vise l'extraction d'informations fines, depuis le corpus de cas cliniques utilisé lors de l'édition 2019. Ce guide d'annotation a pour objectif de détailler les catégories et règles d'annotation utilisées pour annoter le corpus. Les types de catégories sont inspirés des catégories utilisées lors de précédents challenges similaires, en particulier les campagnes i2b2. L'objectif final consiste à accéder aux principales informations cliniques contenues dans des documents relatifs au domaine de la santé.

Table des matières

1. Règles générales

2. Catégories

2.1. Autour des patients

Anatomie

Toutes les parties anatomiques (bras, cellules, cytoplasme, diaphragme, genoux, pancréas, peau, reins).

On annote le maximum d'informations venant préciser les parties anatomiques, notamment les adjectifs qualificatifs (calice inférieur ; cavité abdominale ; cavités excrétrices ; cordon spermatique ; glandes prostatiques ; orifice inguinal profond droit ; paroi thoracique ; paroi vésicale ; parties discales ; tissu prostatique ; veine cave inférieure ; voie excrétrice), les adjectifs de latéralité (rein gauche ; testicule droit), et les informations de quantité telles que les chiffres (deux testicules). En revanche, les articles initiaux sont exclus.

On vise l'annotation la plus descriptive possible, même si la portion intègre des prépositions : lèvre antérieure du col vésical ; loge de néphrectomie ; plan du muscle grand pectoral ; pôle inférieur du testicule ; quadrants externes du sein droit.

On annote également les formes adjectivales qui sont utilisés comme information de localisation avec d'autres catégories (abdominale ; anatomo-pathologique ; artériolaire ; capillaires ; interstitiels ; latéroaortique ; osseuse ; pelviennes ; pyélique ; rénal ; rénale ; thoraco-abdominal ; thyroïdienne). Ces annotations peuvent concerner d'autres catégories, comme :

2.2. Autour de la pratique clinique

Examen

Concerne à la fois les examens biologiques, chirurgicaux, cliniques (bilan biologique ; échographie ; créatinémie ; cytoscopie ; débitmétrie ; immunohistochimie ; toucher rectal) ainsi que les pratiques dont les résultats permettent un examen (étude histologique ; ponction scannoguidée) et les termes correspondants à des résultats d'examen (biopsie ; globules blancs ; grade de Syrjanen ; taux de l'hémoglobine ; taux de PSA ; volume de la prostate).

Comme pour les autres catégories, les adjectifs qualificatifs qui viennent préciser l'examen réalisé, y compris pour des informations de localisation, font partie de la portion annotée (urétéropyelographie rétrograde gauche). Les adjectifs ordinaux ("premier", "deuxième", etc.) ne sont pas annotés.

Les parties anatomiques qui viennent préciser l'organe sur lequel l'examen est réalisé font partie de la portion annotée (scanner abdominal ; tomodensitométrie cérébrale ; urographie intraveineuse).

Pour cette catégorie, on annote également les expressions génériques lorsque le contexte rend nécessaire cette annotation : examen clinique ; examens complémentaires. Par contre, le simple terme "examen", parce qu'il est trop générique, n'est pas annoté lorsqu'on peut trouver dans la suite du texte une mention d'examen plus spécifique.

Pathologie

Concerne les maladies et tout ce qui est pathologique (adénocarcinome ; adénopathie ; carcinome ; fistule ; néphroblastome ; prolapsus ; pyonéphrose ; rhabdomyosarcome ; tumeur*) avec les adjectifs qualificatifs et de localisation (cystite aiguë ; lombalgies gauches).

*Les tumeurs malignes sont annotées "Pathologie" tandis que les tumeurs bénignes seront annotées "Signe ou symptôme".

Les parties anatomiques qui viennent préciser l'organe touché par la pathologie font partie de la portion annotée (amylose prostatique ; cancer du rein ; carcinome papillaire des voies excrétrices ; tumeur rénale gauche) dans la mesure du possible (peut se révéler compliqué avec des structures de phrase complexes et des imbrications).

Signe ou symptôme

Les signes ou symptômes sont proches des pathologies. Ils sont utilisés pour poser un diagnostic qui révèle la pathologie du patient.

Ils renvoient à :

Les portions annotées peuvent être composées de plusieurs termes de localisation et qualificatifs séparés par des virgules, conduisant à des portions annotées longues : hyperfixation au niveau pulmonaire, médiastinal, pancréatique ; hématurie totale abondante avec formation de caillots ; lésions framboisées faisant saillie dans la vessie ; nette diminution de la fixation du rein droit. Les frontières de ces portions doivent être envisagées sous l'angle d'une seule idée par portion annotée, même si plusieurs informations peuvent venir compléter cette idée.

2.3. Autour des traitements

Substance

Renvoie aux substances pharmacologiques utilisées par le patient (médicaments, noms commerciaux et génériques). Les substances, lorsqu'elles servent à réaliser un examen, sont annotées comme des examens.

Informations associées aux substances
Dose

Tout dosage médicamenteux, composé d'une valeur et d'une unité, y compris lorsque le dosage est calculé par rapport au poids ou à la masse corporelle du patient (50 mg ; 1,1 mg/kg/dose ; 37,5 mg/m2/dose), ou de dosage moins précis (dose maximale ; première dose ; deuxième dose).

Durée

Durée du traitement médicamenteux (depuis cinq ans ; pendant dix jours). On inclut les prépositions, déterminants, etc.

Traitement chirurgical

Cette catégorie renvoie aux traitements chirurgicaux mis en place pour soigner une pathologie. Il faut considérer que ce sont des traitements interventionnels. La catégorie intègre des éléments anatomiques, des adjectifs de localisation ou apportant des précisions sur le traitement chirurgical réalisé : clampagne premier du cordon spermatique ; curage axillaire ; néphrectomie ; orchidopexie in-dartos ; résection endoscopique.

Un traitement peut également être précisé par un mode ou par une fréquence.

Un traitement qui n'est pas interventionnel mais qui repose sur l'utilisation de substances (chimiothérapie) sera alors annoté comme "Substance".

Mode

Cette catégorie est utilisée aussi bien avec une "Substance" qu'avec un "Traitement".

  1. Mode d'administration du médicament (application topique ; en inhalation ; en nébulisation ; intraveineuse ; perfusé ; perfusion ; voie orale), y compris sous forme d'abréviations (IM*, IV**, SC***), et forme galénique (crème).
  2. *IM=intramusculaire, **IV=intraveineux, ***SC=sous-cutané

  3. Mode d'accès d'un traitement chirurgical (abord périnéal ; curetage rétropéritonéal ; échographie cardiaque transthoracique et transœsophagienne 3D (ETO) ; sonde rectale ; urographie intraveineuse). Ces modes se présentent généralement sous la forme d'un préfixe "intra-", "per-", "sus-", "trans-" suivi d'une partie anatomique (e.g., intraveineux, percutanée). Dans ces cas, on a une double annotation avec un mode intégré dans un traitement : <traitement>curetage <mode>rétropéritonéal</mode></traitement>.
  4. Si la partie anatomique désigne la partie traitée, elle est alors annotée en anatomie (on n'intègre pas d'anatomie dans un mode) :

Pas d'annotation isolée en mode dans une phrase s'il n'y a pas également un "traitement" ou une "substance".

Fréquence

Cette catégorie est utilisée aussi bien avec une "Substance" qu'avec un "Traitement", mais également un "Examen".

Valeur

Renvoie aux valeurs et unités, grades, adjectifs qualificatifs, etc., correspondant à des résultats d'examen, ou à des descriptions de signes ou symptômes : était estimé à 30 grammes ; carcinome papillaire des voies excrétrices de bas grade (stade PT1) ; lésion hypodense de 6 cm du pancréas ; des cellules épithéliales normales ; L'ECBU de contrôle était stérile. On annote également les adjectifs et expressions "(a)normal(e)(s)", "négatif", "positif", "sans particularité" (= normal) dans la mesure où ces expressions apportent une précision, notamment pour poser un diagnostic.

2.4. Autour du temps

Date

Numéro de jour dans le mois, mois (en toutes lettres ou sous la forme d'un numéro), année : 1999 ; mars 1995 ; septembre.

Moment

Permet de spécifier la temporalité d'un événement dans la chronologie du patient (un âge peut ainsi être annoté comme un moment), vis à vis d'un séjour hospitalier, d'un examen, d'une prise de médicament, d'un traitement, etc. Les prépositions (à, avant, après, dans, en, etc.) font partie de la portion annotée : dans 6 mois ; En 2001, soit quatre ans après la néphrectomie ; on a réalisé en postopératoire un scanner ; On notait dans ses antécédents une orchidectomie droite à l'âge de 10 ans, une lobectomie... ; Un mois après, la patiente a été hospitalisée.

3. Exemples

Un nourrisson âgé de 2 mois, présentant une <sosy>hernie <anatomie>inguino-scrotale droite</anatomie></sosy> avec <sosy><anatomie>testicule droit</anatomie> en place</sosy>. Le <sosy><anatomie>testicule gauche</anatomie> est non palpable</sosy>. Le <examen>caryotype</examen> est de type masculin (<valeur>46XY</valeur>). Le malade a été opéré dans un premier temps pour sa <sosy>hernie</sosy>. L'<examen>exploration opératoire</examen> a trouvé un <sosy><anatomie>sac herniaire</anatomie> large</sosy> dont l'ouverture a permis de découvrir <sosy>deux <anatomie>testicules</anatomie> de taille <valeur>normale</valeur>, d'aspect poly-microkystique</sosy> avec <sosy>indépendance <anatomie>épididymo-testiculaire</anatomie> partielle</sosy>. Les <sosy>deux <anatomie>canaux déférents</anatomie> étaient fusionnés à leurs parties distales</sosy> (Figure1). L'<examen>exploration</examen> du coté controlatéral <sosy>n'a pas trouvé de <anatomie>testicule</anatomie></sosy>. Le <anatomie>testicule gauche</anatomie> a été <traitement>récupéré par voie intra-pèritonéale à travers l'<anatomie>orifice inguinal profond droit</anatomie></traitement>. La <traitement>dissection des <anatomie>cordons spermatiques</anatomie></traitement> a permis d'obtenir une longueur suffisante et une <traitement>orchidopexie in-dartos</traitement> a été réalisée des deux cotés. Les suites opératoires étaient simples. L'<examen>étude <anatomie>anatomo-pathologique</anatomie></examen> des <examen>biopsies</examen> réalisées <moment>en per-opératoire</moment> a montré un <sosy><anatomie>tissu testiculaire</anatomie> <valeur>normal</valeur> d'aspect infantile</sosy> compatible avec l'age du patient. L'enfant a été examiné <moment>à l'age de 8 mois</moment>, les <sosy>deux <anatomie>testicules</anatomie> étaient en place de taille et consistance <valeur>normales</valeur></sosy>. Une <examen>échographie <anatomie>abdominale</anatomie></examen> a été réalisée, n'a pas trouvé d'anomalies associées.

Last modified: Fri Mar 20 12:26:14 CET 2020