BQSS#

Description générale#

Le domaine BQSS est le domaine d’agrégation “final” des données BQSS. Il rassemble tous les autres domaines (domaine FINESS, domaine Certification, domaine IQSS domaine SAE). La réalisation de cette partie de la chaîne de traitements a donc comme pré-requis l’exécution des pipelines de tous les autres domaines de données.

Le but de ce domaine est d’agréger chacun des fichiers des autres domaines. Tous les autres domaines fournissent un fichier clé-valeur et un fichier CSV de métadonnées.

Traitements et agrégation des données#

Cette phase est décomposée en 4 phases décrites par la suite :

  1. Agrégation des valeurs

  2. Référentiel FINESS

  3. Agrégation des métadonnées et des nomenclatures

  4. Constitution de la base document

Agrégation des valeurs#

Le premier traitement effectué par le pipeline du domaine BQSS est l’agrégation des fichiers clé-valeur des autres domaines (SAE, Certifications, IQSS et Activités). Cette agrégation sera sauvegardée dans le fichier data/bqss/final/valeurs.csv en fin de pipeline.

Lors de cette phase d’agrégation ont lieu plusieurs “redescente” de valeurs. L’opération de “redescente” consiste à reporter des valeurs remontées par FINESS juridique sur certains FINNES géographiques qui leur sont rattachés.

Redescente des IQSS PSY 2022#

Les IQSS de Psychiatrie 2022 sont remontés sur un mix de FINESS géographiques et juridiques en fonction du type d’établissement concerné.

On utilise la SAE pour reporter les valeurs concernées uniquement aux FINESS géographiques qui ont les bonnes activité de psychiatrie. Seuls les FINESS géographiques qui ont strictement plus d’une journée d’hospitalisation à temps complet en psychiatrie (infantile et adulte) “reçoivent” les valeurs de leur FINESS juridique.

Redescente des décisions de certification#

C’est également lors de cette étape que toutes les décisions de certification par thématiques associées à une Entité Juridique (EJ) sont rattachés aux établissements géographiques (ET) liés. Comme tous les établissements ne réalisent pas forcément l’activité correspondant à une décision par thématique donnée, il s’agit ensuite de supprimer les lignes de données associées à de telles redescentes inadaptées. Pour ce faire, le fichier Gestion des FINESS et des données (gestion_des_finess_et_des_donnees_V3.8_en cours.docx) spécifie les critères identifiant les établissement concernés par chaque thématique. En pratique, le fichier ne couvre pas exhaustivement les thématiques de certification. En cas de thématique manquante, le comportement par défaut qui a été implémenté consiste à considérer que tous les établissements sont concernés par la thématique.

Voici les critères utilisés pour la redescente des décisions de certification:

  • Droits des patients : tous les établissements sont concernés

  • Parcours des patients : tous les établissements sont concernés

  • Médicaments : tous les établissements sont concernés

  • Urgences : l’indicateur est à afficher si et seulement si l’établissement a répondu « Oui » à la question A16 sur l’autorisation de structure d’urgences dans le bordereau « FILTRE » de la SAE

  • Bloc opératoire : l’indicateur est à afficher si et seulement si la réponse est « Oui » à la question A18 sur l’activité de bloc opératoire dans le bordereau « FILTRE » de la SAE

  • Radiothérapie : l’indicateur est à afficher si et seulement si la réponse est « Oui » à la question A9 concernant les activités cliniques dans le bordereau « FILTRE » de la SAE

  • Endoscopie : l’indicateur est à afficher si et seulement si la case A5 ou A14 ou B14 est strictement supérieure à 0 (>0) dans la partie « Description des salles d’intervention et/ou d’exploitation de l’établissement » du bordereau « BLOCS – Sites opératoires et salles d’intervention » de la SAE

  • Imagerie interventionnelle : l’indicateur est à afficher si et seulement si la réponse est « Oui » à la question A34 sur l’activité interventionnelle sous imagerie médicale, par voie endovasculaire, en neuroradiologie soumise à autorisation dans le bordereau « FILTRE » de la SAE

  • Salle de naissance : l’indicateur est à afficher si et seulement si l’établissement a des activités de maternité

  • Management stratégique : tous les établissements sont concernés

  • Qualité de vie au travail : tous les établissements sont concernés

  • Management de la qualité et des risques : tous les établissements sont concernés

  • Risque infectieux : tous les établissements sont concernés

  • Douleur : tous les établissements sont concernés

  • Fin de vie : l’indicateur est à afficher uniquement pour les établissements MCO, SSR, SLD et HAD

  • Dossier patient : tous les établissements sont concernés

  • Identification du patient : l’indicateur est à afficher uniquement pour les établissements MCO, SSR, PSY et SLD

  • Biologie : l’indicateur est à afficher si et seulement si la réponse est « Oui » à la question A20 sur l’activité de biologie médicale dans le bordereau « FILTRE » de la SAE

  • Imagerie : l’indicateur est à afficher si et seulement si la réponse est « Oui » à la question A19 sur l’activité d’imagerie dans le bordereau « FILTRE » de la SAE

  • Don d’organes et de tissus : l’indicateur est à afficher uniquement pour les établissements MCO

  • Ressources humaines : tous les établissements sont concernés

  • Ressources financières : tous les établissements sont concernés

  • Système d’information : tous les établissements sont concernés

  • Processus logistiques : tous les établissements sont concernés

Référentiel FINESS#

Exclusion de certains FINESS#

Le second traitement est la construction du référentiel FINESS qui est sauvegardé en fin de pipeline dans le fichier data/bqss/final/finess.csv. Ce référentiel est un sous-ensemble du référentiel FINESS produit par le domaine FINESS. Les filtres appliqués ont une double origine.

D’une part, ils sont liés aux autorisations d’activités de soins. Les règles appliquées pour ces filtres sont celles référencées dans le document de Gestion des FINESS et des données (gestion_des_finess_et_des_donnees_V3.8_en cours.docx). À savoir, seuls les établissements disposant d’au moins une autorisation d’activités de soins parmi les suivantes sont affichés dans QualiScope :

  • Médecine

  • Chirurgie

  • Gynécologie/Obstétrique

  • Psychiatrie (en hospitalisation complète)

  • Soins de longue durée

  • Soins de suite et de réadaptation

  • Hospitalisation à domicile.

  • Néphrologie

D’autre part, l’autre règle de filtrage s’appuie sur le fichier data/bqss/final/valeurs.csv résultant de l’agrégation des fichiers clé-valeur. En effet, certains numéro FINESS ne sont pas présents dans ce fichier et sont donc exclus du référentiel FINESS, afin de garantir la spécificité de ce référentiel.

Colonne actif_qualiscope#

une fois le filtrage des FINESS effectué, on rajoute aussi une colonne actif_qualiscope aux données. Cette colonne est indique si l’établissement concerné est considéré actif du point de vue du site internet.

Pour plus de détail voir Création du filtre actif_qualiscope

Agrégation des métadonnées#

Le troisième traitement important concerne l’agrégation des fichiers de métadonnées et de nomenclatures. Comme pour les fichiers clé-valeur, chaque domaine dispose d’un fichier de métadonnées. L’ensemble de ces fichiers est agrégé au sein du domaine BQSS pour donner le fichier data/bqss/final/metadata.csv en sortie de pipeline. Le procédé est similaire pour la table de nomenclatures qui est sauvegardée sous le nom de data/bqss/final/nomenclatures.csv.

À noter qu’il existe un cinquième et dernier fichier en sortie du pipeline BQSS : data/bqss/final/autorisations-as.csv. Aucune transformation n’est réalisée sur ce fichier par rapport à son état en sortie du pipeline du domaine FINESS.

Constitution de la base document#

Le quatrième et dernier traitement est la constitution de la base document. C’est le résultat de cette étape qui est utilisé pour afficher les données disponibles sur les site de la HAS.

La base document est un fichier au format JSONL. Chaque ligne de ce fichier correspond à un établissement FINESS géographique. Pour chaque établissement, on stocke un grand nombre d’informations, voir le schémas détaillé pour plus d’informations.

Ce traitement utilise toutes les donnée précédemment générées pour les regrouper par établissement géographique et par année. On génère aussi un fichier de statistiques nationales par année pour chaque indicateur ayant une classe.

Validation des données#

La validation des données du domaine BQSS est réalisée par la librairie frictionless et le standard Table Schema. Cette validation s’appuie sur 3 fichiers de métadonnées (un pour chaque table concernée) au format JSON et se trouvant dans le dossier schemas/bqss : metadata.json, valeurs.json et nomenclature.json.

La validation des données de la base document est faite avec pydantic.