DataV : une API de données électorales ouvertes au service des enquêtes par panel

sciencesconf.org:jdev26:720383

Malaury Lemaitre-Salmon^1, @

1 : Centre de données socio-politiques de Sciences Po (Sciences Po, CNRS)
Sciences Po, Centre National de la Recherche Scientifique

Dans le cadre du panel ELIPSS (Étude Longitudinale par Internet Pour les Sciences Sociales, https://www.sciencespo.fr/cdsp/fr/projets/projets-en-cours/panel-elipss/), géré par le CDSP de Sciences Po Paris, les ingénieurs de recherche conçoivent régulièrement des enquêtes électorales soumises à plusieurs milliers de panélistes. Ces enquêtes posent un défi technique récurrent : comment afficher à chaque répondant la vraie liste des candidats de sa circonscription ou de sa commune — selon qu'il s'agit d'élections législatives ou municipales — à partir du seul code postal renseigné à l'inscription ? Nous présentons DataV, une API REST développée pour répondre à ce besoin, qui alimente dynamiquement des questionnaires Qualtrics. À partir du code postal d'un répondant, l'API guide progressivement le panéliste : sélection de la commune lorsque plusieurs correspondent, puis de la circonscription si nécessaire (cas des grands arrondissements urbains), avant de retourner les candidats correspondants — permettant une personnalisation fine du questionnaire sans intervention manuelle sur chaque vague d'enquête. Le cœur de la présentation porte sur les défis techniques rencontrés : Gestion des référentiels temporels : Le découpage géographique évolue d'une élection à l'autre : les circonscriptions de 2017 ne sont pas forcément celles de 2024, et les communes changent au fil des fusions. L'architecture distingue explicitement la carte électorale de chaque scrutin, garantissant qu'une requête sur les législatives 2024 utilise bien le bon découpage — et non celui d'une élection précédente. Qualité et hétérogénéité des sources ouvertes : fichiers La Poste, données du Ministère de l'Intérieur — retour d'expérience sur les pièges de ces sources et sur la manière de construire un pipeline d'import fiable et reproductible avec Polars. Branchement à Qualtrics : exposer une API consommable par du JavaScript embarqué dans un questionnaire Le projet expose également une interface de visualisation de données politiques (gouvernements, lois, compositions parlementaires) Le projet s'appuie sur Django 5 / DRF, Polars, PostgreSQL et Kubernetes. Ce retour d'expérience s'adresse aussi bien aux ingénieurs de recherche qui construisent des infrastructures de données au service de la collecte, qu'aux développeurs travaillant sur l'exposition de données publiques dans un contexte de recherche.

Type : : Présentation

Thématiques : Développement web