- EAN13
- 9782746288362
- Éditeur
- Hermès science publications
- Date de publication
- 22/11/2012
- Collection
- Systèmes d'information et organisations documentaires
- Langue
- français
- Fiches UNIMARC
- S'identifier
Expérimentations et évaluations en fouille de textes
Un panorama des campagnes DEFT
Stéphane Chaudiron, Cyril Grouin, Dominic Forest
Hermès science publications
Systèmes d'information et organisations documentaires
Autre version disponible
La fouille de textes est une activité combinant traitements informatiques et
données linguistiques avec comme objectif principal l’extraction et
l’organisation automatique des informations présentes dans les textes. Deux
familles de méthodes permettent d’atteindre ce but : celles à base de
connaissances d’experts et celles reposant sur un apprentissage automatique
supervisé. Une campagne d’évaluation consiste à confronter les systèmes
développés par plusieurs équipes sur un même jeu de données et en un temps
limité. Créé en 2005 à l’image des campagnes anglo-saxonnes, le défi fouille
de textes (DEFT) est aujourd’hui la seule campagne d’évaluation francophone en
fouille de textes. Cet ouvrage rassemble les méthodes utilisées lors des
différentes éditions du défi. Les thématiques relèvent de la classification de
documents en genres et thèmes, de la fouille d’opinions et de l’identification
de la période de parution d’un document.
données linguistiques avec comme objectif principal l’extraction et
l’organisation automatique des informations présentes dans les textes. Deux
familles de méthodes permettent d’atteindre ce but : celles à base de
connaissances d’experts et celles reposant sur un apprentissage automatique
supervisé. Une campagne d’évaluation consiste à confronter les systèmes
développés par plusieurs équipes sur un même jeu de données et en un temps
limité. Créé en 2005 à l’image des campagnes anglo-saxonnes, le défi fouille
de textes (DEFT) est aujourd’hui la seule campagne d’évaluation francophone en
fouille de textes. Cet ouvrage rassemble les méthodes utilisées lors des
différentes éditions du défi. Les thématiques relèvent de la classification de
documents en genres et thèmes, de la fouille d’opinions et de l’identification
de la période de parution d’un document.
S'identifier pour envoyer des commentaires.