PROXIMITÉ ET CHOIX POLITIQUE, LES ENSEIGNEMENTS DE L'OPEN DATA

PROXIMITÉ ET CHOIX POLITIQUE, LES ENSEIGNEMENTS DE L'OPEN DATA

L’éloignement des centres urbains et le retrait des services publics des zones rurales sont souvent cités comme un moteur du vote populiste. Le premier déclencheur des manifestations des « gilets jaunes » a été l’augmentation du prix des carburants, qui concerne au premier chef les populations qui sont obligées de prendre leur voiture pour aller travailler. Enfin, dans un autre registre, la promesse d’Emmanuel Macron d’exonérer tous les contribuables (ou la plus grande partie d’entre eux) de la taxe d’habitation est souvent citée comme un des leviers de son élection. Les travaux de Christophe Guilluy (La France périphérique, comment on a sacrifié les classes populaires) ou de Hervé Le Bras et Emmanuel Todd (Le Mystère français) sont des exemples d’études du lien entre localisation et politique.
Ainsi, ces enjeux de proximité sont au centre du débat politique. Pourtant, la mise en évidence quantitative de l’impact de ces questions sur le vote est balbutiante. Elle repose sur des corrélations bivariées ou des juxtapositions de cartes. Nous montrons dans notre intervention que les conclusions que l’on peut tirer avec des outils d’analyses quantitatives aussi simplistes peuvent être gravement erronées.
A partir d’une quinzaine de fichiers issus de l’Open Data, contenant des centaines de caractéristiques des 36 000 communes de France, nous estimons un modèle reliant les votes à la présidentielle de 2017 de deux candidats populistes (Marine Le Pen et Jean-Luc Mélenchon) et d’Emmanuel Macron avec l’ensemble de ces caractéristiques. Nous pouvons ainsi mesurer la corrélation entre le vote et des données issues du recensement (sexe, âge, csp, diplôme, type de logement, propriétaire/locataire, moyen de transport pour aller au travail, distance lieu de travail/résidence, type de contrat de travail, durée de travail, taux de chômage, nombre d’étrangers, nombre d’immigrés, type de commune), de l’équipement des communes en différents services ou commerces (police, justice, impôt, pôle emploi, poste, banque, services de proximité, grandes surfaces, commerces de proximité, éducation, hôpitaux, urgences, maternité, médecins généralistes, médecins spécialistes, pharmacie, gare, équipement sportif), de données sur les revenus et les inégalités dans la commune, ainsi que sur la taxe d’habitation.
L’intérêt de notre analyse n’est pas seulement d’être multivariée. Elle prend aussi en compte la possible endogénéité des données, en utilisant la méthode que nous avons présentée au congrès Big Data World de novembre 2016, qui a été primée par le Best Paper Award 2017 d’Esomar.
Deux conclusions peuvent être tirées du travail présenté :
- Les enjeux nationaux (revenu, chômage) ou les attitudes individuelles (utilisation de la voiture) expliquent une part de variance du vote populiste plus importante que ce qui a trait à des enjeux locaux,
- A l’heure du Big Data (et c’était déjà le cas un peu avant….), il est possible de faire des analyses quantitatives prenant en compte simultanément plusieurs dizaines de variables. Non seulement possible, mais en fait indispensable. Préférer la simplicité de l’analyse conduit vite au simplisme, et à une mauvaise compréhension des phénomènes.

Laurent Florès

Associé, SLPV Analytics

Antoine Moreau

Associé, SLPV Analytics