DEFT2012

accueilprésentationcorpusévaluationsoumissionactes

Corpus

Corpus d'apprentissage

A partir du 6 février 2012 pour les équipes inscrites. Ce corpus se compose d'articles scientifiques complets (liste et nombre de mots clés, résumé et corps de l'article) qui ont paru entre 2001 et 2008 dans quatre revues de Sciences Humaines et Sociales.

Corpus de test

A partir du 9 avril 2012. Ce corpus reprend les mêmes caractéristiques que celles du corpus d'apprentissage ; la liste des mots clés n'est bien évidemment pas intégrée...

Format de sortie

Le format de sortie doit être de la forme :
nom du fichier<TABULATION>mots-clés;séparés;par;un point-virgule

as_2001_000207ar.xml Labrecque;économie politique;féminisme;ethnographie
as_2001_000211ar.xml Lem;économie politique;rapports hommes-femmes;famille;procès de travail;agriculture;France
as_2001_000234ar.xml Guerreiro;tourisme;culture régionale;ethnicité;benua';Indonésie