Corpus

Les participants disposeront d'un ensemble de tweets rédigés en français pour l'entraînement dans un premier temps, puis d'un deuxième ensemble de tweets pour la phase de test. Le corpus (15 000 tweets) et les annotations ont été réalisés dans le cadre du projet uComp. La thématique concerne les changements climatiques

Conformément aux règles d'accès à Twitter et d'utilisation des tweets, lors des phases de développement et de test, les participants auront à disposition les identifiants des tweets et les outils permettant de constituer le corpus par eux-mêmes. En cas de difficulté, les participants sont invités à contacter les organisateurs.

Des corpus d'entraînement seront fournis aux participants inscrits à partir du 16 février 2015. Le test aura lieu du 4 au 10 mai 2015. À partir de la date qu'ils auront choisie dans cet intervalle, les participants auront trois jours pour appliquer, sur les corpus de test, les méthodes mises en œuvre sur les corpus d'entraînement.

Corpus d'entraînement

Le corpus d'entraînement est disponible sous la forme suivante :

Corpus de test

Le corpus de test est disponible sous la forme suivante :

Références

Entrainement

Les données de références pour les trois tâches sont disponique dans l'archive Train_References-22042015.zip (mise à jour de la référence de la tâche 3 - 22 avril 2015).

Test

Les données de références pour les trois tâches sont disponique dans l'archive Test_References.zip.


Accès aux corpus hors challenge

Nous donnons accès aux ressources produites (corpus, annotations, script d'évaluation) après acceptation des conditions suivantes.

Dans le travail que vous produirez et pour toute publication (rapport de stage, article, etc.), nous vous remercions :

Par ailleurs, une fois votre travail terminé, nous vous remercions de bien vouloir nous envoyer une copie de votre rapport.

Si vous acceptez ces conditions, merci de prendre contact (deft2015 @ limsi.fr). Nous vous donnerons alors accès aux données produites.