Ouvrir la boîte noire des marchés du logement

Alors que le Parlement français examine la possibilité de donner accès aux données immobilières locales, détenues par l’administration fiscale, cet article présente les sources actuellement disponibles et montre dans quelle mesure ces données permettraient une meilleure compréhension de l’évolution locale des marchés immobiliers résidentiels.

Les marchés immobiliers jouent un rôle central dans l’évolution des territoires. Derrière les tendances nationales, les contextes locaux sont très contrastés (Cusin 2016). Dans beaucoup de villes françaises, la tendance est à l’augmentation des prix, particulièrement dans le secteur du logement. D’autres villes voient au contraire leurs prix stagner ou diminuer (Charmes 2018). De telles disparités se retrouvent aussi à une échelle intra-urbaine : les territoires reconnus comme dynamiques abritent bien souvent des quartiers en perte de vitesse et inversement (Guérois et Le Goix 2009 ; Coulondre 2017).

La pleine compréhension des marchés immobiliers nécessite donc une approche locale, voire micro-locale. C’est un enjeu de connaissance non seulement pour les chercheurs qui étudient l’évolution des territoires (Boulay et al. 2012), mais aussi pour les acteurs (publics et privés) qui interviennent dans ces territoires et qui souhaitent comprendre les dynamiques à l’œuvre (Figeat 2016). Mais en pratique, la capacité à rendre compte des marchés immobiliers au niveau local et micro-local est souvent limitée par la disponibilité des données.

L’accès aux données immobilières est aujourd’hui inscrit à l’agenda politique puisque les parlementaires français se penchent depuis quelques mois sur l’ouverture des données « Demande de valeurs foncières » (DVF) gérées par la Direction générale des finances publiques (DGFIP). L’accès à cette source constituerait un tournant important dans l’étude des marchés immobiliers locaux, dans la mesure où il s’agirait de disposer de données gratuites et géolocalisées portant sur l’ensemble des transactions immobilières réalisées en France.

Dans un tel contexte, cet article propose un panorama des principales sources de données permettant de mener une analyse des marchés du logement à une échelle locale (communale ou infracommunale). L’article revient ensuite sur le débat concernant l’ouverture des données DVF et décrit les changements que pourraient apporter cette ouverture.

Panorama des sources concernant les marchés du logement

En France, au moins une vingtaine de sources proposent des informations immobilières systématiques à une échelle locale (voir figure 1). Ces sources se répartissent en quatre groupes : celles qui caractérisent le stock de logements, celles qui décrivent la production (autorisations et mises en chantier), celles qui rendent compte des activités locatives (locations de longue durée ou saisonnières), enfin, celles qui répertorient les ventes (et/ou les mises en vente).

Figure 1. Principales sources [1] de données permettant une analyse territorialisée des marchés du logement en France [2]

Cliquer ici pour agrandir le tableau

Données de stocks, données de la production de logements

Le premier groupe, celui des données de stock, est composé principalement de quatre sources produites par des institutions publiques : les Fichiers fonciers et la base FILOCOM de la DGFIP, le recensement de la population de l’INSEE, ainsi que le Répertoire du parc locatif social (RPLS) mis à disposition par le Service de l’observation et des statistiques (SOES) du ministère de la Transition écologique et solidaire (MTES). En s’appuyant sur une définition sensiblement différente du « logement » et sur un périmètre plus ou moins spécifique (parc privé ou social), ces sources proposent un comptage du parc en indiquant, pour des mailles géographiques très fines, non seulement le nombre de logements existants, mais aussi leurs caractéristiques ainsi que celles des propriétaires. De telles données permettent des analyses sur la transformation du parc et ses déterminants (Ribardière 2016 ; CEREMA 2017a ; Gimat 2017).

Dans ce premier groupe de sources, il faut aussi mentionner une référence originale. En effet, le fournisseur d’énergie ENEDIS donne, dans certaines conditions, accès aux informations de ses compteurs électriques. Ceci permet notamment d’identifier les logements vacants (Helary 2018).

Un autre ensemble de sources caractérise la production de logements. Ici, la référence la plus utilisée est publique. Il s’agit de la base SITADEL2 fournie par le SOES. Celle-ci délivre des indications concernant le nombre de logements autorisés et mis en chantier chaque année dans les communes (ou pour des mailles infracommunales dans la version détaillée du fichier). Elle ouvre ainsi la voie à des analyses géographiques détaillées de la production [3].

Soucieux de pouvoir compter sur des informations plus régulièrement actualisées, les acteurs de la production immobilière ont mis au point des sources alternatives. Ces sources proposent de façon quasi mensuelle un descriptif de l’avancement des programmes de logements, notamment de ceux que mènent les promoteurs immobiliers. Elles s’appuient sur un croisement d’informations officielles (les permis de construire) et d’informations déclaratives (recueillies à travers des enquêtes téléphoniques auprès des entreprises de construction). On peut citer ici les données de la Fédération des promoteurs immobiliers (FPI), ou celles que proposent des cabinets d’études comme CECIM, Explore ou Adequation. L’accès à ces données est en principe payant, mais des conventions partenariales peuvent être établies, notamment pour les exploiter dans le cadre de projets scientifiques (Coulondre et Lefebvre 2018).

Les données des locations et des ventes

Un troisième groupe de sources caractérise le marché locatif. Les données CLAMEUR et OSLO ainsi que celles de l’Observatoire des loyers délivrent des informations sur les loyers pour le secteur privé.

Pour le secteur social, il faut se rapporter une nouvelle fois au RPLS.

Notons par ailleurs que les données de la plateforme de location saisonnière Airbnb sont collectées et rendues disponibles par l’entreprise américaine AirDna. Cette source est payante, mais permet néanmoins d’alimenter avec des analyses chiffrées le débat actuel sur l’inflation que sont suspectées produire ces formes de locations temporaires (Ayouba et al. 2018).

Enfin, un dernier ensemble de sources concerne les ventes de logements. Certaines de ces sources reposent sur un périmètre spécifique. C’est le cas de l’enquête ECLN du SOES, qui porte uniquement sur la commercialisation des logements neufs. C’est le cas aussi des données ERA, Se Loger ou MeilleursAgents qui caractérisent les marchés locaux en s’appuyant sur l’activité enregistrée par des réseaux d’agences immobilières.

D’autres sources sur les transactions visent l’exhaustivité dans le recensement. Ici, la source notariale est la plus connue et la plus utilisée. En France, chaque transaction immobilière fait en effet l’objet d’un acte notarié. Les notaires disposent ainsi en théorie de toute l’information sur les ventes de logements. Depuis la fin des années 1980, ils compilent ces informations dans deux bases de données dont ils commercialisent l’accès. Il s’agit de la base BIEN pour l’Île-De-France et de PERVAL pour le reste du territoire.

La fiche complète d’une transaction comprend : les caractéristiques du bien vendu, sa localisation, son prix de vente, ainsi que des informations sur le profil des vendeurs et des acheteurs. L’accès à ces informations est très coûteux. Depuis quelques mois, suite à des discussions avec les pouvoirs publics, les notaires se sont engagés néanmoins à rendre accessible à titre gratuit le prix médian enregistré dans chaque commune (Rey-Lefebvre 2017). Des partenariats avec le monde scientifique ont aussi vu le jour ces dernières années. Ils ont permis de mener des analyses détaillées sur les marchés immobiliers d’une ville (Filippi et al. 2007 ; Bermond et Marie 2016) ou de comparer les marchés des différentes métropoles (Cusin et Juillard 2012).

Pour finir, notons que la thématique du big data se diffuse progressivement dans le monde des études immobilières, poussant praticiens et chercheurs à se pencher sur des sources de données non conventionnelles construites sur la base d’une collecte systématique des informations présentes sur Internet (sites d’annonces, Twitter, cadastre en ligne, etc.), mais dont on peut questionner la représentativité (Beresewicz 2015 ; Le Goix et al. 2018).

« Demande de valeurs foncières » (DVF) : la nouvelle donne des données fiscales ?

Ce panorama des données immobilières pourrait être reconfiguré prochainement avec l’ouverture des données « Demande de valeurs foncières (DVF) » (DVF). Ces données portent sur les transactions. Elles sont produites par la DGFIP qui répertorie dans le cadre de ses missions fiscales toutes les mutations immobilières et foncières réalisées à titre onéreux en France.

D’un point de vue technique, la constitution de la base DVF s’appuie sur la centralisation de tous les actes établis par les notaires. DVF a donc le même point de départ que BIEN et PERVAL. Néanmoins, les différences entre ces sources sont nombreuses (Casanova et al. 2017).
D’abord, il y a la question de l’exhaustivité. La constitution d’une base de données est une mission secondaire pour les notaires qui alimentent le système d’informations uniquement sur la base du volontariat. En revanche, il s’agit d’un point central pour la DGFIP, qui veille pour des raisons fiscales à repérer chacune des mutations. DVF est donc la source la plus complète sur les transactions immobilières, ce que montrent des comparaisons menées dans différents territoires [4].

Une autre différence tient au fait que DVF est une source gratuite. Aujourd’hui, elle est accessible sans frais pour quelques ayants droit publics, au premier rang desquels les collectivités territoriales.

Les bases fiscales et notariales se distinguent par ailleurs sur le plan de la structuration de l’information. BIEN et PERVAL sont des sources conçues spécifiquement pour l’étude des marchés. Elles ne délivrent pas des informations « brutes » mais retraitées. À l’inverse, DVF n’est pas pensée comme une donnée de marché. L’information y est plus brute et offre davantage de marges de manœuvre à l’analyste pour construire les catégories qui lui semble pertinentes (Coulondre 2017). DVF permet par exemple de construire des typologies de marchés à une échelle infracommunale en prenant en compte à la fois les ventes dans le neuf et dans l’ancien.

Le principal avantage affiché des données notariales face aux données fiscales concerne le nombre de variables proposées pour décrire les transactions. Les données BIEN et PERVAL contiennent par exemple des informations sur le profil des acquéreurs et des vendeurs, ce qui a permis notamment aux chercheurs d’étudier le rôle des marchés immobiliers dans le changement sociologique des territoires (Desponds et Bergel 2013). Ces informations ne figurent pas dans DVF. Néanmoins, la source comporte des indications cadastrales très précises permettant une jointure avec les Fichiers fonciers. DVF peut ainsi être enrichie avec un nombre important de nouvelles variables qui permettent de caractériser non seulement le profil des propriétaires mais aussi l’histoire des biens échangés [5].

Pour conclure, on peut donc dire que DVF cumule de nombreux avantages qui en font la source la plus pertinente pour étudier les transactions immobilières à une échelle locale. Or, à ce jour DVF n’est accessible qu’à un nombre restreint d’ayants droit. Un mouvement d’ouverture a été esquissé ces dernières années, mais reste encore incertain.

L’open data immobilier : un débat public entre protection des données personnelles et enjeux de connaissance

L’ouverture des données immobilières de la DGFIP est un mouvement de fond que l’on peut suivre au moins depuis 2006. À cette date est votée la loi « ENL » (Engagement national pour le logement), dans laquelle un article prévoit qu’un ensemble d’acteurs publics (collectivités territoriales, services de l’État, agences d’urbanisme, établissements publics de coopération intercommunale, etc.) puissent avoir accès à titre gratuit aux informations de l’administration fiscale concernant les mutations immobilières enregistrées dans leur territoire.

En 2016, la loi « Pour une République numérique » ouvre en principe DVF à de nouveaux destinataires, comme : « les chercheurs », « les professionnels de l’immobilier », « les observatoires », ou encore « les personnes dont l’activité consiste à développer des services contribuant à la transparence du marché immobilier ». Ces dispositions n’ont pas été mises en œuvre à ce jour. Les acteurs publics impliqués depuis 2011 sont toujours les seuls à avoir accès à la base. Certains chercheurs ont pu néanmoins y recourir en mettant au point des conventions partenariales avec des collectivités territoriales (Casanova et al. 2017 ; Coulondre 2017).

Le débat sur l’ouverture des données DVF a pris un nouveau tournant en 2017 et 2018 avec l’avant-projet de loi Logement ELAN (Évolution du logement et aménagement numérique), dont l’article 3 concernait l’amélioration de la transparence des données foncières. Le débat se poursuit désormais avec le passage à l’Assemblée nationale du projet de loi « ESSOC » (pour un État au service d’une société de confiance). Le 30 janvier, les députés ont voté un article 4 ter ainsi rédigé : « Afin de concourir à la transparence des marchés fonciers et immobiliers, l’administration fiscale rend librement accessible au public, sous forme électronique, les éléments d’information qu’elle détient au sujet des valeurs foncières déclarées à l’occasion des mutations intervenues au cours des cinq dernières années. » L’Assemblée nationale propose alors d’aller plus loin que la loi République numérique et d’instaurer le principe d’open data pour les données DVF.

Au mois de mars 2018, l’article 4 ter du projet de loi ESSOC a été modifié par le Sénat, qui est revenu sur le principe d’ouverture totale des données en rétablissant la liste des ayants droit fixée par la loi République numérique. De plus, le Sénat a ajouté une référence au principe de protection des données personnelles, en indiquant : « Toutefois les informations accessibles excluent toute identification nominative du propriétaire du bien. » Par cet ajout, les sénateurs ont indirectement remis en cause l’usage de la donnée à une échelle locale, puisque lorsque la focale territoriale se précise, la possibilité d’identifier les vendeurs ou les acheteurs par recoupement avec d’autres sources de données se renforce. Si cette version de l’article 4 ter était conservée, les données DVF seraient délivrées par la DGFIP sans références cadastrales ni communales. Les députés se penchent à nouveau sur ce texte depuis le 26 juin 2018. Ils devraient bientôt donner (au moins de façon temporaire) une issue à ce débat.

Ces discussions illustrent la tension qui entoure le mouvement d’open data, entre d’un côté le principe de respect des données personnelles, et de l’autre le potentiel de connaissance et de services lié à l’accès à de nouvelles sources de données. Au cœur de cette tension, se trouve finalement la question de l’échelle (scientifiquement pertinente ou politiquement acceptable) d’analyse des marchés immobiliers [6].

Bibliographie

Notes

[1L’accès à ces données, notamment pour le niveau géographique minimum, nécessite bien souvent une demande spéciale auprès des gestionnaires de la source.

[2Ce panorama retient uniquement les sources collectant de manière systématique des informations sur l’offre ou les transactions immobilières, délivrables à une échelle communale ou infracommunale, et pour l’ensemble des villes du pays. De ce fait, notre panorama est plus spécifique que d’autres recensements proposés sur le sujet (Driant et al. 2005 ; Chappert et al. 2014).

[3Précisons que les données de SITADEL2 sont construites via une centralisation des permis de construire instruits localement par les collectivités. Une telle méthode de collecte implique des délais de mise à disposition relativement longs. Elle se traduit aussi parfois par des informations lacunaires dues à la non-remontée de certains permis de construire.

[4Une expérimentation menée dans l’aire urbaine d’Avignon en 2017 montre par exemple que PERVAL couvre seulement 67 % des transactions recensées dans DVF (Casanova et al. 2017, p. 722). Une autre comparaison menée en Île-de-France entre 2006 et 2011 porte ce chiffre à 90 % (DRIEA Île-de-France 2013).

[5Cette version enrichie a été proposée par le CEREMA sous le nom de « DV3F » (DVF + Fichiers fonciers). Pour un exemple d’utilisation de ces données, voir par exemple CEREMA 2017b.

[6Notons que l’INSEE fait face au même type de problème dans le cadre de la diffusion des résultats du recensement de la population. L’institut accepte néanmoins de délivrer ses informations à l’échelle infracommunale pour des mailles territoriales ad hoc que sont les IRIS (Îlots regroupés pour l’information statistique). Dans le cas de DVF, cette solution serait acceptable pour le monde de la recherche. Le serait-elle pour les acteurs de la production urbaine, qui doivent souvent mener des réflexions à l’échelle d’une rue, voire d’une portion de rue ?

Pour citer cet article :

Alexandre Coulondre, « Ouvrir la boîte noire des marchés du logement », Métropolitiques, 9 juillet 2018. URL : https://www.metropolitiques.eu/Ouvrir-la-boite-noire-des-marches-du-logement.html
©metropolitiques.eu - Toute reproduction interdite sans autorisation explicite de la rédaction