BQSS#
Description générale#
Le domaine BQSS est le domaine d’agrégation “final” des données BQSS. Il rassemble tous les autres domaines (domaine FINESS, domaine Certification, domaine IQSS domaine SAE). La réalisation de cette partie de la chaîne de traitements a donc comme pré-requis l’exécution des pipelines de tous les autres domaines de données.
Le but de ce domaine est d’agréger chacun des fichiers des autres domaines. Tous les autres domaines fournissent un fichier clé-valeur et un fichier CSV de métadonnées.
Traitements et agrégation des données#
Cette phase est décomposée en 4 phases décrites par la suite :
Agrégation des valeurs
Référentiel FINESS
Agrégation des métadonnées et des nomenclatures
Constitution de la base document
Agrégation des valeurs#
Le premier traitement effectué par le pipeline du domaine BQSS est l’agrégation des fichiers clé-valeur des autres domaines (SAE, Certifications, IQSS et Activités).
Cette agrégation sera sauvegardée dans le fichier data/bqss/final/valeurs.csv
en fin de pipeline.
Lors de cette phase d’agrégation ont lieu plusieurs “redescente” de valeurs. L’opération de “redescente” consiste à reporter des valeurs remontées par FINESS juridique sur certains FINNES géographiques qui leur sont rattachés.
Redescente des IQSS PSY 2022#
Les IQSS de Psychiatrie 2022 sont remontés sur un mix de FINESS géographiques et juridiques en fonction du type d’établissement concerné.
On utilise la SAE pour reporter les valeurs concernées uniquement aux FINESS géographiques qui ont les bonnes activité de psychiatrie. Seuls les FINESS géographiques qui ont strictement plus d’une journée d’hospitalisation à temps complet en psychiatrie (infantile et adulte) “reçoivent” les valeurs de leur FINESS juridique.
Redescente des décisions de certification#
C’est également lors de cette étape que toutes les décisions de certification par thématiques associées à une Entité Juridique (EJ) sont rattachés aux établissements géographiques (ET) liés.
Comme tous les établissements ne réalisent pas forcément l’activité correspondant à une décision par thématique donnée, il s’agit ensuite de supprimer les lignes de données associées à de telles redescentes inadaptées.
Pour ce faire, le fichier Gestion des FINESS et des données (gestion_des_finess_et_des_donnees_V3.8_en cours.docx
) spécifie les critères identifiant les établissement concernés par chaque thématique.
En pratique, le fichier ne couvre pas exhaustivement les thématiques de certification.
En cas de thématique manquante, le comportement par défaut qui a été implémenté consiste à considérer que tous les établissements sont concernés par la thématique.
Voici les critères utilisés pour la redescente des décisions de certification:
Droits des patients
: tous les établissements sont concernésParcours des patients
: tous les établissements sont concernésMédicaments
: tous les établissements sont concernésUrgences
: l’indicateur est à afficher si et seulement si l’établissement a répondu « Oui » à la question A16 sur l’autorisation de structure d’urgences dans le bordereau « FILTRE » de la SAEBloc opératoire
: l’indicateur est à afficher si et seulement si la réponse est « Oui » à la question A18 sur l’activité de bloc opératoire dans le bordereau « FILTRE » de la SAERadiothérapie
: l’indicateur est à afficher si et seulement si la réponse est « Oui » à la question A9 concernant les activités cliniques dans le bordereau « FILTRE » de la SAEEndoscopie
: l’indicateur est à afficher si et seulement si la case A5 ou A14 ou B14 est strictement supérieure à 0 (>0) dans la partie « Description des salles d’intervention et/ou d’exploitation de l’établissement » du bordereau « BLOCS – Sites opératoires et salles d’intervention » de la SAEImagerie interventionnelle
: l’indicateur est à afficher si et seulement si la réponse est « Oui » à la question A34 sur l’activité interventionnelle sous imagerie médicale, par voie endovasculaire, en neuroradiologie soumise à autorisation dans le bordereau « FILTRE » de la SAESalle de naissance
: l’indicateur est à afficher si et seulement si l’établissement a des activités de maternitéManagement stratégique
: tous les établissements sont concernésQualité de vie au travail
: tous les établissements sont concernésManagement de la qualité et des risques
: tous les établissements sont concernésRisque infectieux
: tous les établissements sont concernésDouleur
: tous les établissements sont concernésFin de vie
: l’indicateur est à afficher uniquement pour les établissements MCO, SSR, SLD et HADDossier patient
: tous les établissements sont concernésIdentification du patient
: l’indicateur est à afficher uniquement pour les établissements MCO, SSR, PSY et SLDBiologie
: l’indicateur est à afficher si et seulement si la réponse est « Oui » à la question A20 sur l’activité de biologie médicale dans le bordereau « FILTRE » de la SAEImagerie
: l’indicateur est à afficher si et seulement si la réponse est « Oui » à la question A19 sur l’activité d’imagerie dans le bordereau « FILTRE » de la SAEDon d’organes et de tissus
: l’indicateur est à afficher uniquement pour les établissements MCORessources humaines
: tous les établissements sont concernésRessources financières
: tous les établissements sont concernésSystème d’information
: tous les établissements sont concernésProcessus logistiques
: tous les établissements sont concernés
Référentiel FINESS#
Exclusion de certains FINESS#
Le second traitement est la construction du référentiel FINESS qui est sauvegardé en fin de pipeline dans le fichier data/bqss/final/finess.csv
.
Ce référentiel est un sous-ensemble du référentiel FINESS produit par le domaine FINESS.
Les filtres appliqués ont une double origine.
D’une part, ils sont liés aux autorisations d’activités de soins.
Les règles appliquées pour ces filtres sont celles référencées dans le document de Gestion des FINESS et des données (gestion_des_finess_et_des_donnees_V3.8_en cours.docx
).
À savoir, seuls les établissements disposant d’au moins une autorisation d’activités de soins parmi les suivantes sont affichés dans QualiScope :
Médecine
Chirurgie
Gynécologie/Obstétrique
Psychiatrie (en hospitalisation complète)
Soins de longue durée
Soins de suite et de réadaptation
Hospitalisation à domicile.
Néphrologie
D’autre part, l’autre règle de filtrage s’appuie sur le fichier data/bqss/final/valeurs.csv
résultant de l’agrégation des fichiers clé-valeur.
En effet, certains numéro FINESS ne sont pas présents dans ce fichier et sont donc exclus du référentiel FINESS, afin de garantir la spécificité de ce référentiel.
Colonne actif_qualiscope
#
une fois le filtrage des FINESS effectué, on rajoute aussi une colonne actif_qualiscope
aux données.
Cette colonne est indique si l’établissement concerné est considéré actif du point de vue du site internet.
Pour plus de détail voir Création du filtre actif_qualiscope
Rattrapage des coordonnées géographiques manquantes#
Certains Finess peuvent être temporairement non-géocodés. Ceci pose un problème pour les finess qui sont `actif_qualiscope” dans la mesure où ils doivent être affichés sur une carte.
Pour contourner ce problème, on affecte ls dernières coordonnées connues aux finess sans coordonnées géographiques.
Agrégation des métadonnées#
Le troisième traitement important concerne l’agrégation des fichiers de métadonnées et de nomenclatures.
Comme pour les fichiers clé-valeur, chaque domaine dispose d’un fichier de métadonnées.
L’ensemble de ces fichiers est agrégé au sein du domaine BQSS pour donner le fichier data/bqss/final/metadata.csv
en sortie de pipeline.
Le procédé est similaire pour la table de nomenclatures qui est sauvegardée sous le nom de data/bqss/final/nomenclatures.csv
.
À noter qu’il existe un cinquième et dernier fichier en sortie du pipeline BQSS : data/bqss/final/autorisations-as.csv
.
Aucune transformation n’est réalisée sur ce fichier par rapport à son état en sortie du pipeline du domaine FINESS.
Constitution de la base document#
Le quatrième et dernier traitement est la constitution de la base document. C’est le résultat de cette étape qui est utilisé pour afficher les données disponibles sur les site de la HAS.
La base document est un fichier au format JSONL. Chaque ligne de ce fichier correspond à un établissement FINESS géographique. Pour chaque établissement, on stocke un grand nombre d’informations, voir le schémas détaillé pour plus d’informations.
Ce traitement utilise toutes les donnée précédemment générées pour les regrouper par établissement géographique et par année. On génère aussi un fichier de statistiques nationales par année pour chaque indicateur ayant une classe.
Validation des données#
La validation des données du domaine BQSS est réalisée par la librairie frictionless et le standard Table Schema.
Cette validation s’appuie sur 3 fichiers de métadonnées (un pour chaque table concernée) au format JSON et se trouvant dans le dossier schemas/bqss
: metadata.json
, valeurs.json
et nomenclature.json
.
La validation des données de la base document est faite avec pydantic.