infomedicament_data
activeCe projet vise à extraire et structurer les informations médicales des fichiers RCP (Résumé des Caractéristiques du Produit) des médicaments pour faciliter l'analyse et l'intégration dans des pipelines de données.
Python
DocumentationFeatures
- Extraction RCP
- Parsing HTML robuste
- Traitement images
- Analytics et statistiques
- Export multi-format (CSV, JSONL)
Tech Stack
Dépendances
beautifulsoup4chardetmysql-connector-pythonpandastqdmlxmlPoetry
Composants
- Module Python
- Interface ligne de commande
- Tests unitaires
- Base de données MySQL
Tags
Changelog
Changelog : infomedicament_data (derniers 30 jours)
Résumé
Ce projet a récemment subi une refactorisation importante pour moderniser son environnement de développement. Le passage à Poetry pour la gestion des dépendances et des environnements simplifiera la maintenance et la reproductibilité du projet. Des corrections ont également été apportées pour assurer le bon fonctionnement des tests et l'application des règles de linting.
Évolutions techniques
- Refactorisation : Utilisation de Poetry pour la gestion du projet et des dépendances (#4783000)
- Refactorisation : Réorganisation de la structure du projet (#080a123)
- Linting : Intégration de Ruff pour le linting et suppression de Black (#a5016ee)
- Tests : Correction de bugs pour assurer le bon fonctionnement des tests (#2f636b1)
Autres changements
- Documentation : Ajout de quelques commentaires aux tests (#a7d1953)
Métriques
- Stars
- 0
- Forks
- 0
- Open Issues
- 0
- Last Activity
- 1 months ago
Information
- Target Audience
- Professionnels
- Authentication
- none
- Testing
- pytest, pytest-cov