etalab-ia

58 dépôts878 commits
GitHub

Activite des contributions

878 commits dans 59 dépôts
Lun
Mer
Ven
Moins
Plus

Synthèse d'activité : etalab-ia (derniers 7 jours)

Résumé de l'activité

L'organisation etalab-ia a connu une semaine riche en activités, avec des améliorations significatives apportées à plusieurs de ses dépôts. OpenGateLLM a été particulièrement actif, avec des corrections de bugs, des améliorations de l'interface utilisateur et des optimisations techniques. Lettabot a également reçu des mises à jour importantes, notamment un assistant de configuration interactif pour Slack et Discord, et une nouvelle approche de configuration basée sur des fichiers YAML. D'autres dépôts comme BlockNote, evalap et mediatech ont bénéficié de corrections de bugs, d'améliorations de la documentation et d'optimisations de l'infrastructure. Ces mises à jour visent à améliorer la stabilité, la convivialité et la flexibilité des outils mis à disposition des utilisateurs.

Sécurité

Aucun changement lié à la sécurité n'a été signalé durant cette période.

Autres changements notables

  • Refonte de la structure des charts Helm pour OpenGateLLM, avec séparation en deux charts distincts (opengatellm-core et opengatellm-stack). opengatellm-helm
  • Migration vers la version 6 du SDK AI dans BlockNote. BlockNote
  • Suppression de Streamlit de la configuration de production d'evalap, pour une meilleure gestion des déploiements. evalap
  • Ajout du support du modèle Kimi K2.5 et du fournisseur ZAI dans letta-code. letta-code
  • Implémentation d'un système de configuration basé sur un fichier YAML dans lettabot, remplaçant progressivement les variables d'environnement. lettabot

Dépôts les plus actifs

  • BlockNote : Nombreuses corrections de bugs et améliorations de l'expérience utilisateur, notamment concernant les tableaux, l'authentification et l'export HTML.
  • OpenGateLLM : Corrections de bugs, améliorations de l'interface utilisateur du playground, optimisations de la recherche et de la gestion des collections.
  • lettabot : Ajout d'un assistant de configuration interactif pour Slack et Discord, et une nouvelle approche de configuration basée sur des fichiers YAML.
  • evalap : Amélioration de l'exportation des résultats vers Hugging Face et de la documentation.
  • opengatellm-helm : Refonte de la structure des charts Helm pour une plus grande flexibilité.

Dépôts (58)

rag-facile

etalab-ia

Python

RAG Facile est une trousse de démarrage pour la construction d'applications RAG (Retrieval-Augmented Generation) dans l'administration française, en utilisant l'API Albert. Elle est conçue pour des projets exploratoires.

MITDocs
RAGLLMPython+3
0
1
2d ago

OpenGateLLM

etalab-ia

Python

OpenGateLLM est une API gateway open-source, prête pour la production, optimisée pour les modèles auto-hébergés. Elle est conçue pour centraliser, sécuriser et gérer l'accès à l'IA générative de manière souveraine et économique.

MITDocs
APILLMSelf-hosted+2
122
19
3d ago

letta-code

etalab-ia

TypeScript

Letta Code est un environnement de codage axé sur la mémoire, construit sur l'API Letta. Il permet de travailler avec un agent persistant qui apprend au fil du temps et est portable entre différents modèles.

Apache-2.0Docs
IAAgent conversationnelCodage+4
0
0
2w ago

opengatellm-helm

etalab-ia

Shell

Ce dépôt contient le chart Helm pour déployer OpenGateLLM et ses composants sur Kubernetes. Il fournit deux charts : un pour le cœur d'OpenGateLLM et un pour la stack complète avec des dépendances optionnelles.

MITDocs
kuberneteshelmopengatellm+6
0
3
2w ago

BlockNote

etalab-ia

TypeScript

BlockNote est un éditeur de texte riche basé sur des blocs, open source, avec React. Il permet d'ajouter facilement une expérience d'édition moderne à vos applications.

MPL-2.0Docs
rich-text-editorreacttypescript+5
3w ago

mediatech

etalab-ia

Python

Ce projet traite des données publiques mises à disposition par diverses administrations afin de faciliter l'accès à des données vectorisées et prêtes à l'emploi pour les applications d'IA dans le secteur public.

MITDocs
IALLMdatasets+5
7
2
3w ago

evalap

etalab-ia

Python

EvalAP est une plateforme et une API de haut niveau conçues pour effectuer des évaluations pour Etalab. Ce projet fournit une API pour évaluer les modèles de langage (LLM) et une interface pour naviguer dans les ensembles de données, les modèles, les métriques et les expériences.

MITDocs
IALLMévaluation+6
20
6
3w ago

albert-data-collections

etalab-ia

Python

Ce projet fournit des fonctionnalités et des pipelines utiles liées aux collections de données d'ALBERT. Il permet de mettre à jour et de gérer ces collections de données de manière automatisée.

MITDocs
data-collectionsdata-managementautomation+1
1
2
4w ago

OpenMockLLM

etalab-ia

Python

OpenMockLLM est un serveur d'API mock LLM basé sur FastAPI qui simule plusieurs fournisseurs d'API de grands modèles de langage. Il permet de tester et de prototyper des applications utilisant des LLM sans dépendre des services externes.

MITDocs
llmmockapi+5
4
1
1mo ago

marker-serve

etalab-ia

Python

Ce serveur FastAPI permet de traiter des documents en utilisant la bibliothèque marker-pdf pour les environnements de production. Il s'inspire du script serveur officiel de Marker.

MITDocs
FastAPIPDFOCR+3
1
1
1mo ago

assistant-prompts

etalab-ia

Jinja

Ce projet est un test pour les prompts d'assistants IA. Il vise à explorer et valider différentes formulations de prompts pour améliorer les performances des assistants.

IApromptsassistant+1
0
0
1mo ago

chartsgouv

etalab-ia

Python

ChartsGouv est une distribution d’Apache Superset intégrant le thème DSFR (Design Système de l’État Français). Elle vise à fournir un Superset DSFR prêt à l’emploi pour les administrations publiques.

OtherDocs
dsfrsupersetvisualisation+2
32
6
3mo ago

albert-conversation

etalab-ia

Python

Open WebUI est une plateforme d'IA auto-hébergée, extensible et conviviale, conçue pour fonctionner entièrement hors ligne. Elle prend en charge divers runners LLM comme Ollama et des API compatibles OpenAI, avec un moteur d'inférence intégré pour RAG.

BSD-3-Clause LicenseDocs
IALLMRAG+7
4mo ago

assistant-ia-pipelines

etalab-ia

Python

Ce dépôt contient les pipelines utilisés sur assistant-ia (anciennement albert-conversation).

Docs
pipelinesIAassistant-ia+2
0
3
4mo ago

InfraScale

etalab-ia

Python

InfraScale est un outil développé par l'équipe Albert API pour estimer les besoins en GPU pour l'inférence LLM à grande échelle. Il fournit une méthodologie reproductible, ouverte et pratique pour estimer les besoins en GPU.

Docs
LLMGPUInference+5
7
1
5mo ago

opengatellm-mcp-bridge

etalab-ia

Ce projet sert de pont entre OpenGatellm et MCP (Machine Comprehension Pipeline). Il facilite l'intégration et la communication entre ces deux systèmes pour des tâches de traitement du langage naturel.

OpenGatellmMCPMachine Comprehension+1
0
0
6mo ago

franceservices-backend

etalab-ia

Python

Ce dépôt est le backend web pour Albert, un projet visant à fournir des modèles d'IA générative aux agents de la fonction publique. Il permet d'accéder à des données françaises officielles pour répondre aux questions des agents administratifs.

MITDocs
IALLMAdministration+4
121
10
6mo ago

franceservices-frontend

etalab-ia

TypeScript

Ce dépôt fournit une interface visuelle pour interagir avec l'API d'Albert, le chatbot LLM du gouvernement français pour les maisons France services. Il permet aux agents administratifs de poser des questions et d'obtenir des réponses basées sur des sources de données officielles françaises.

Docs
IALLMReact+3
4
4
6mo ago

data_gouv_fr_mcp_server

etalab-ia

Python

Ce serveur MCP simple renvoie des jeux de données pour une requête donnée. Il permet de faciliter l'accès aux données de data.gouv.fr.

MITDocs
mcpdata-gouv-frserver+1
0
1
8mo ago

mcp-servers

etalab-ia

Python

Ce projet fournit un serveur de protocole de contexte de modèle (MCP) pour les données officielles du gouvernement français. Il permet d'interroger et d'utiliser ces données avec des modèles de langage.

MITDocs
mcpllmdata-gouv-fr+1
1
0
10mo ago

albert-tchap

etalab-ia

Python

Bot pour Tchap utilisant Albert, l'agent conversationnel de l'administration française. Ce bot permet de répondre à des questions sur Tchap en utilisant un modèle de langage.

MITDocs
botllmmessaging+3
15
2
1y ago

albert-frontend

etalab-ia

TypeScript

Ce projet a pour but de fournir une interface visuelle pour interagir avec l'API d'Albert, le chatbot LLM du gouvernement français. Il est encore en développement et peut contenir des éléments spécifiques à France Services.

Docs
chatbotLLMReact+4
1
1
1y ago

etalab.gouv.fr

etalab-ia

HTML

Ce dépôt contient le site web d'Etalab, la mission chargée de promouvoir l'ouverture des données publiques en France. Il fournit des informations sur les initiatives, les événements et les ressources liés à l'open data.

Docs
open datagouvernement ouvertdonnées publiques+1
0
2
1y ago

formIAble

etalab-ia

Python

Ce projet vise à faciliter l'extraction d'informations à partir de formulaires, notamment les formulaires CERFA, en utilisant des techniques de reconnaissance optique de caractères (OCR) et d'intelligence artificielle.

MITDocs
OCRFormulairesCERFA+6
4
0
2y ago

pseudo_api

etalab-ia

Python

Cette API fait partie de l'effort de pseudonymisation des documents mené par le Lab IA d'Etalab. Elle permet aux développeurs d'automatiser la pseudonymisation de documents avec leurs propres modèles.

MITDocs
pseudonymisationNERNLP+3
19
2
2y ago

pseudo_app

etalab-ia

Python

Cette application de démonstration fait partie de l'effort de pseudonymisation des documents mené par Etalab's Lab IA. Elle permet de tester un outil de pseudonymisation développé pour aider le Conseil d'État à ouvrir ses décisions de justice au public.

MITDocs
pseudonymisationnamed-entity-recognitionNLP+3
11
4
2y ago

GPT-gouv

etalab-ia

Python

Ce projet vise à améliorer la qualité des services publics en utilisant des modèles de langage de grande taille (LLM). Il permet de s'appuyer sur ces modèles pour répondre aux besoins des usagers.

MITDocs
LLMNLPPython+4
7
0
2y ago

ami-ia-ineris

etalab-ia

Python

Ce dépôt contient le code pour le projet AMI IA 2 de l'INERIS. Il vise à développer un outil de caractérisation des composés chimiques pour l'identification de substances, de sources de pollution et la caractérisation de sources de pollution de l'air.

OtherDocs
IAEnvironnementPollution+5
0
0
3y ago

piaf-ml

etalab-ia

Python

Ce projet vise à fournir une solution de question-réponse en français facilement activable. Il a pour objectif de préparer les données, évaluer les performances et expérimenter différentes approches pour un pipeline de QA.

MITDocs
ianlppiaf+3
8
0
3y ago

ami-ia-dgs

etalab-ia

Python

Ce projet vise à analyser les signalements de la DGS grâce à des techniques d'intelligence artificielle. Il comprend l'ingestion de données, la classification et le regroupement des signalements, ainsi qu'une interface de traitement.

Docs
intelligence artificielleanalyse de donnéessignalement+4
0
0
3y ago

ami-ia-dgcl

etalab-ia

JavaScript

Ce dépôt contient le code source du projet AMI IA 2 de la DGCL. Il vise à développer des outils d'intelligence artificielle pour l'analyse de documents juridiques.

Docs
IAJuridiqueNLP+4
0
1
3y ago

explainable-demo

etalab-ia

Python

Ce dépôt vise à proposer et générer une "Carte de modèle" pour faciliter la réutilisation et améliorer la qualité des modèles d'algorithmes. Il permet de documenter les modèles et leur évolution.

MITDocs
modèlealgorithmeexplicabilité+2
0
0
3y ago

toolbox

etalab-ia

Python

Ce dépôt contient des snippets de code utilisés pour divers besoins, notamment pour la plateforme code.gouv.fr du gouvernement français.

MITDocs
snippetscode.gouv.frpython
1
0
3y ago

ami-ia-insee-aiee2

etalab-ia

Python

Ce dépôt contient le code source du projet AMI IA 2 de l'INSEE. Il vise à développer des outils et des modèles d'intelligence artificielle pour l'INSEE.

MITDocs
IAINSEEDonnées+3
1
0
3y ago

DGML

etalab-ia

Python

Le projet DGML vise à la construction d'un catalogue de jeux de données de data.gouv.fr pour le Machine Learning. Il permet de sélectionner rapidement des jeux de données adaptés aux tâches de ML et d'obtenir un aperçu rapide des informations utiles.

MITDocs
machine learningdata sciencedata catalog+3
12
0
3y ago

ocr-xtract

etalab-ia

Python

OCR-Xtract est un outil qui effectue de la reconnaissance optique de caractères (OCR) et de l'extraction d'informations à partir de documents. Il vise à accélérer le travail des agents de l'État traitant des documents dont les formats ne sont pas directement exploitables numériquement.

MITDocs
OCRInformation ExtractionDocument Processing+4
16
2
3y ago

ami-ia-crmana

etalab-ia

Python

Ce dépôt contient le code pour le projet AMI IA 2 de la CRMA NA. Il permet d'entraîner et d'utiliser des modèles pour optimiser l'implantation des artisans et évaluer leur pérennité.

Docs
machine-learningdata-scienceartisan+3
3
0
3y ago

climate-stations-coverage

etalab-ia

HTML

Cette étude rapide vise à examiner où le couverture des stations d'observation climatique pourrait être renforcée.

Docs
climatstationscouverture+2
0
0
3y ago

liria-site

etalab-ia

Vue

Ce site web est développé par etalab-ia. Il semble être une plateforme d'information ou de présentation, potentiellement liée à l'intelligence artificielle (IA) ou à des sujets connexes.

Docs
VuePressDSFRdocumentation+1
0
0
3y ago

pseudo_conseil_etat

etalab-ia

Python

Ce package permet l'exploitation et la transformation des fichiers DOC du Conseil d'État pour la modélisation du langage et la reconnaissance d'entités nommées. Il inclut également le code pour entraîner un modèle baseline Flair.

MITDocs
NLPConseil d'ÉtatPseudonymisation+2
9
1
3y ago

doctr

etalab-ia

Python

doctr est une bibliothèque accessible et performante pour la reconnaissance de texte dans les documents, utilisant le deep learning pour les tâches liées à l'OCR.

Apache-2.0Docs
deep-learningdocument-recognitionocr+5
4
0
4y ago

pdf_api

etalab-ia

Python

Cette API permet de convertir des fichiers PDF numérisés en fichiers texte et PDF éditables. Elle supporte le traitement de fichiers uniques ou multiples.

MITDocs
PDFOCRPython+3
1
0
4y ago

ami-ia

etalab-ia

Jupyter Notebook

Ce dépôt regroupe les ressources du programme AMI IA, accompagnant les administrations publiques dans l'expérimentation de l'IA. Il agrège la documentation, les contenus des ateliers et les bonnes pratiques pour la communauté AMI IA.

OtherDocs
IAIntelligence ArtificielleAMI+4
3
1
4y ago

knowledge-base

etalab-ia

Shell

Cette base de connaissances est celle du Lab IA d'Etalab. Elle vise à centraliser et partager les connaissances et les ressources du laboratoire.

MITDocs
iaknowledge
6
3
4y ago

piaf-ranker

etalab-ia

Python

Piaf-ranker est un modèle de jugement de pertinence français qui utilise CamemBERT comme base et attribue un score à un passage de texte en fonction de sa pertinence par rapport à une requête donnée. Il est utilisé pour reranker des documents dans une approche de ranking en plusieurs étapes.

Docs
rankingrelevancefrench+4
1
0
4y ago

text_extractor_from_xml

etalab-ia

Python

Ce projet extrait le texte et les métadonnées des fichiers XML des décisions de justice.

Docs
XMLExtraction de texteMétadonnées+2
0
0
4y ago

hubeau_chatbot

etalab-ia

Python

Ce chatbot a pour objectif de répondre à des questions sur le domaine de l'eau, en utilisant des techniques de traitement du langage naturel pour extraire des informations pertinentes.

Docs
chatbotNLPtraitement du langage naturel+4
1
0
4y ago

auto-sklearn

etalab-ia

Python

auto-sklearn est un toolkit d'apprentissage automatique et un remplacement direct pour un estimateur scikit-learn. Il automatise le processus de sélection et d'optimisation des modèles d'apprentissage automatique.

BSD-3-ClauseDocs
automated-machine-learningautomlbayesian-optimization+4
0
0
4y ago

dbpedia-demonyms-fr

etalab-ia

Python

Ce projet fournit des données sur les démonymes français associés aux entités de DBpedia. Il permet d'obtenir les noms des habitants pour différents lieux et pays en français.

Docs
DBpediaDémonymesFrance+3
0
0
4y ago

demo-heideltime

etalab-ia

Python

Ce projet implémente un wrapper Python pour l'analyseur temporel HeidelTime. Il utilise l'application HeidelTime-standalone pour effectuer l'analyse temporelle du texte.

GPL-3.0Docs
PythonHeidelTimeAnalyse Temporelle+2
0
0
4y ago

explainable_api

etalab-ia

Python

Ce projet utilise l'apprentissage automatique pour prédire la validation ou le refus de demandes administratives. L'objectif principal est de comprendre et d'expliquer les choix pris par les algorithmes.

Docs
machine-learningexplainable-aiadministrative-requests+3
0
0
4y ago

piaf_agent

etalab-ia

Vue

Ce projet est un frontend pour une application de question-réponse (comme Piaf). Il permet aux utilisateurs de poser des questions et d'obtenir des réponses pertinentes.

MITDocs
elasticsearchmoteur-de-recherchepiaf+3
1
1
4y ago

ami-ia-chub-app

etalab-ia

JavaScript

Cette application web permet d'accéder et d'analyser des données médicales. Elle offre une interface pour visualiser des informations provenant de différentes sources, comme des rapports de laboratoire et des données cliniques.

Docs
santédonnées médicalesFHIR+3
0
0
4y ago

ami-ia-chub

etalab-ia

Python

Ce dépôt contient le code source du projet AMI IA 2 du CHU de Bordeaux. Il vise à développer et déployer des solutions d'intelligence artificielle dans le domaine de la santé.

Docs
IASantéFHIR+5
2
1
4y ago

ami-ia-dgs-app

etalab-ia

JavaScript

Cette application est l'interface frontale du projet SGMAP - DGS. Elle interagit avec le backend Python du projet pour fournir des fonctionnalités spécifiques.

Docs
JavaScriptReactData Visualization+1
0
0
4y ago

piaf-code

etalab-ia

Java

Ce dépôt contient le code utilisé pour générer l'échantillon Wikipédia français utilisé dans le projet de question-réponse PIAF. Il permet de créer un ensemble de données pour l'entraînement de modèles de question-réponse en français.

MITDocs
piafquestion-answeringNLP+3
11
1
4y ago

data_gouv_text

etalab-ia

Python

Ce dépôt contient le code pour extraire le texte des fichiers PDF trouvés sur data.gouv.fr. Il permet de récupérer et de traiter le contenu textuel de ces documents, facilitant ainsi leur analyse et leur réutilisation.

MITDocs
PDFText ExtractionData Science+3
2
0
4y ago

ami-ia-anssi

etalab-ia

Dépôt de code pour le projet AMI IA 2 de l'ANSSI.

Docs
0
0
4y ago