Ce dépôt contient le code utilisé pour générer l'échantillon Wikipédia français utilisé dans le projet de question-réponse PIAF. Il permet de créer un ensemble de données pour l'entraînement de modèles de question-réponse en français.

Java
MITDocumentation

Tech Stack

Dépendances

spaCy

Composants

  • Annotation de données
  • Génération d'échantillons
  • Analyse statistique
  • Traitement du langage naturel

Tags

Métriques

Stars
11
Forks
1
Open Issues
1
Last Activity
4 years ago

Information

Target Audience
Professionnels
Authentication
none