infomedicament_data

active

betagouv

View on GitHub

Ce projet vise à extraire et structurer les informations médicales des fichiers RCP (Résumé des Caractéristiques du Produit) des médicaments pour faciliter l'analyse et l'intégration dans des pipelines de données.

Python
Documentation

Features

  • Extraction RCP
  • Parsing HTML robuste
  • Traitement images
  • Analytics et statistiques
  • Export multi-format (CSV, JSONL)

Tech Stack

Dépendances

beautifulsoup4chardetmysql-connector-pythonpandastqdmlxmlPoetry

Composants

  • Module Python
  • Interface ligne de commande
  • Tests unitaires
  • Base de données MySQL

Tags

Changelog

Changelog : infomedicament_data (derniers 30 jours)

Résumé

Ce projet a récemment subi une refactorisation importante pour moderniser son environnement de développement. Le passage à Poetry pour la gestion des dépendances et des environnements simplifiera la maintenance et la reproductibilité du projet. Des corrections ont également été apportées pour assurer le bon fonctionnement des tests et l'application des règles de linting.

Évolutions techniques

  • Refactorisation : Utilisation de Poetry pour la gestion du projet et des dépendances (#4783000)
  • Refactorisation : Réorganisation de la structure du projet (#080a123)
  • Linting : Intégration de Ruff pour le linting et suppression de Black (#a5016ee)
  • Tests : Correction de bugs pour assurer le bon fonctionnement des tests (#2f636b1)

Autres changements

  • Documentation : Ajout de quelques commentaires aux tests (#a7d1953)

Métriques

Stars
0
Forks
0
Open Issues
0
Last Activity
1 months ago

Information

Target Audience
Professionnels
Authentication
none
Testing
pytest, pytest-cov