Non. Tous les tweets du corpus d'entrainement sont dans avec
l'archive: TRAIN_TWEETS_ID.zip
Oui. Il est possible que certains tweets aient disparu entre le moment où ils ont été collectés pour l'annotation de référence et le moment où vous les récupérez (ils ont pu être effacés par leur auteur).
NB : L'évaluation ne portera que sur les tweets disponibles à la fin de la phase de test.
La tâche 2.1 inclut la classe INFORMATION qui concerne environs 3500 tweets, alors que pour la tâche 2.2, nous n'avons pas inclus cette classe car tous les tweets de la classe INFORMATION appartiennent à la même classe spécifique : neutre.
Exception in thread "main" java.lang.UnsupportedClassVersionError:
ucomp/twitter/basic_retriever/App : Unsupported major.minor version
51.0
mauvaise version de Java : utiliser Java 1.7 (OpenJDK ou Oracle),
aussi appelé Java7
log4j:WARN No appenders could be found for logger
(ucomp.twitter.basic_retriever.TweetsRetrieverFromIDFromFile).
la commande d'appel au programme java doit spécifier un fichier de
configuration des logs du programme
-Dlog4j.configuration=file:log4j.properties
log4j:ERROR Could not read configuration file from URL
[file:log4j.properties].
un fichier
nommé log4j.properties
doit être présent dans le dossier
à partir duquel on lance la commande de téléchargement
15:53:17,538 ERROR TweetsRetrieverFromIDFromFile:55 - Cannot access
file containing tweets id:
le nom du fichier dans lequel se trouve la liste des tweets à
télécharger doit être spécifié dans le fichier App.properties
présent dans le dossier à partir duquel on lance la commande de
téléchargement :
App.InputFile=my-tweet-id-file.txt
15:57:54,047 INFO TweetsRetriever:126 - Tweet 505339685557006336
successfully retrieved
15:57:54,050 INFO TweetsRetriever:126 - Tweet 504663001132437505
successfully retrieved
15:57:54,050 INFO TweetsRetriever:126 - Tweet 506672487196004352
successfully retrieved
15:57:54,051 INFO TweetsRetriever:126 - Tweet 506829902746636288
successfully retrieved
15:57:54,052 INFO TweetsRetriever:126 - Tweet 506430083008323584
successfully retrieved
15:57:54,052 INFO TweetsRetriever:126 - Tweet 506116782600757249
successfully retrieved
15:57:54,052 INFO TweetsRetriever:126 - Tweet 507388449792335874
successfully retrieved
15:57:54,052 INFO TweetsRetriever:126 - Tweet 507206491330609152
successfully retrieved
bravo, les tweets dont les identifiants sont affichés ont bien été
téléchargés !