DEFT'09
Chiamata       Compito       Comitati e calendario       Corpo
Risultati e pubblicazione       Programma ed atti
 
  [Aiuto]

Compito

Compito Descrizione

Il tema di questa nuova edizione è l'analisi del parere multilingue. Intorno a questo tema, offriamo tre compiti che devono essere svolte separatamente, ma ogni volta che in almeno due lingue fra le tre proposte (inglese, francese, italiano).

Per questi tre compiti che ci sono due corpo multilingue (inglese, francese, italiano), un organismo di Le Monde, The Financial Times e Il Sole 24 Ore, e un organo del Parlamento europeo dibattiti. Il corpus di giornali saranno utilizzati per i primi due compiti, l'individuazione di testi soggettivo e l'individuazione delle soggettivo passaggi di testo. Il corpus di dibattiti parlamentari saranno utilizzati anche per il secondo compito per l'individuazione di soggettivo passaggi di testo, e il terzo compito di determinare il partito politico del diffusore.

Per la formazione dei compiti, quindi ci fornirà 2 corpus:

Per i compiti 1 e 3, i partecipanti saranno quindi i riferimenti potrebbe dar luogo alla formazione. Tuttavia, per i task 2, i partecipanti avranno i testi di giornali e discussioni per lo sviluppo dei loro metodi, ma non i riferimenti su cui sostenere l'apprendimento.

Per la prova, ci sarà fornire ai partecipanti gli stessi tipi di corpo, non classificati. I risultati seguirà il formato XML e saranno valutate da un F-score.

L'uso di altre lingue (lessico di parole, la conoscenza semantica dai grandi corpus, ecc) è consentita, ma solo il corpo di apprendimento fornite devono essere utilizzate per la formazione dei compiti.

Svolgimento del compito

Le squadre che partecipano a DEFT'09 necessario registrarsi utilizzando il modulo online e firmare il "utente finale di risorse linguistiche in un progetto di valutazione".

Corpora di apprendimento saranno forniti ai membri registrati di partecipanti, a partire dal 7 gennaio 2009. Il corpo è composta per il 60% del corpus di origine. Essi contengono la classe attribuita a ciascun testo. I partecipanti avranno circa due mesi e mezzo per sviluppare i loro metodi di classificazione del corpo di apprendimento. Solo il corpo di apprendimento sono ammessi a condizione per la formazione nel compito.

Il 40% del corpo sarà utilizzato per la prova. La prova si svolgerà su una finestra di 30 giorni a partire da metà marzo. A partire dalla data che hanno scelto in questo intervallo, i partecipanti avranno tre giorni di tempo per applicare sul corpo dei metodi di prova utilizzati sul corpo di apprendimento.

Alla fine di questi tre giorni, i partecipanti presenteranno i loro risultati sotto forma di un file (vedi tabella). I risultati file deve rispettare un determinato formato XML.