EXPLORE et Adequation ont développé deux applications croisant leurs propres bases de données des programmes de logements neufs avec la base « Demandes de valeurs foncières » (DVF). Les résultats sont prometteurs, mais l’expérience a mis en lumière un certain nombre d’obstacles à lever pour exploiter tout le potentiel de l’open data du foncier.
L’enjeu de l’open data du foncier est d’améliorer la connaissance des marchés immobiliers au bénéfice des acteurs publics (intérêt général) et rivés (intérêt économique). Dans un précédent article*, nous avons tenté de montrer qu’il était souhaitable d’associer ces derniers (investisseurs, promoteurs, bailleurs, commercialisateurs, experts…) à la valorisation des données de DVF. Peu exploitables en l’état, ces données brutes demandent à être qualifiées en les croisant avec d’autres, souvent détenues par des entreprises.
C’est dans ce sens qu’EXPLORE et Adequation, membres du Lifti, ont expérimenté conjointement l’utilisation des données DVF pour produire une information d’importance stratégique pour la filière du logement collectif neuf : le montant des charges foncières payées en amont par les opérateurs immobiliers. EXPLORE a par ailleurs développé une application permettant de fournir les prix de vente, en aval, des logements aux acheteurs finaux. Ces deux expériences ont donné des résultats intéressants, mais c’est d’abord sur le modus operandi que nous voulons ici nous arrêter.
La déroutante opacité des données DVF
D’une certaine manière, notre démarche a consisté à retracer des opérations de logements collectifs neufs dans la base des DVF. Arrêtons-nous un instant sur les raisons pour lesquelles ce traçage n’est pas possible à l’intérieur de la seule base des DVF, où la notion d’opération immobilière, précisons-le, n’est pas prise en compte. Si l’on part de l’amont, en cherchant à identifier les cessions de charges foncières, on se heurte vite à des obstacles insurmontables. D’abord, les DVF ne fournissent aucune indication sur la destination des fonciers. Certaines informations pourraient la révéler, encore que très imparfaitement, telles que l’identité de l’acquéreur (promoteur, bailleur social, institutionnel) ou encore le régime fiscal de la vente. Or, ces données sont masquées au titre de la protection des données personnelles. Ensuite, une opération immobilière se déroule souvent sur plusieurs parcelles qui ont pu être acquises séparément et faire ainsi l’objet de transactions distinctes, espacées dans le temps, ce qui est source de complexité.
Autre problème de taille, la base des DVF n’est ouverte que pour les transactions postérieures à 2013. Compte tenu du temps nécessaire au développement d’une opération, il peut être impossible de retrouver les acquisitions foncières les plus anciennes. Si l’on part au contraire de l’aval, l’exercice consiste alors à rechercher les ventes de logements collectifs neufs au détail ou en bloc. Il serait relativement plus simple si les ventes d’appartements neufs et anciens étaient distinguées, mais ce n’est malheureusement pas le cas. Une donnée peut nous mettre sur la piste : la mention d’une Vefa. Ce n’est toute fois pas une garantie d’exhaustivité, car elle exclut les « queues » de programme. Mais, surtout, cette mention est fortement sujette à caution. En pratique, la rédaction des actes ou la saisie de données ne semblent pas normalisées. Par exemple, certaines ventes en Vefa passent par un acte unique tandis que d’autres en génèrent plusieurs qu’il faut identifier et relier entre eux manuellement. Enfin, quand bien même nous parviendrions à retracer un nombre significatif d’opérations immobilières à partir des seules informations contenues dans les DVF, hypothèse purement théorique, les données recueillies n’auraient pas un grand intérêt. Pour bien analyser les valeurs foncières, il est en effet nécessaire de les rapporter à des programmes bien définis, et connaître non seulement la surface des appartements, mais aussi leur statut (libre, social,intermédiaire), sachant que la plupart des opérations immobilières mixent ces différentes catégories. Ces informations sont pour la plupart absentes des DVF.
Croiser les données pour « les faire parler »
Pour toutes ces raisons, la seule possibilité de « faire parler» les données DVF consiste à interopérer cette base avec une ou plusieurs bases de données qualifiées, décrivant précisément les opérations immobilières de logements neufs.
C’est justement parce qu’EXPLORE et Adequation disposent de telles bases, couvrant le territoire national, que nous avons pu obtenir les résultats évoqués précédemment. Il s’agit pour EXPLORE de la base Offre future Neuve, pour les projets d’immeubles neufs développés par les promoteurs, bailleurs sociaux et investisseurs, et pour Adequation de la Plateforme Promotion France, pour les logements neufs commercialisés au détail par les promoteurs immobiliers. La démarche consiste à faire coïncider des opérations immobilières connues et qualifiées avec les transactions correspondantes dans la base des DVF, en utilisant les parcelles cadastrales comme « clé de jointure» entre les bases.
Nous avons mis au point des algorithmes qui « dégrossissent » le travail de fourmi à effectuer pour croiser correctement les bases, en particulier pour relier les parcelles et les transactions ressortissant à une même opération immobilière. Une expertise humaine « métier» reste nécessaire pour valider les résultats : il s’agit de vérifier que les valeurs obtenues sont bien cohérentes avec la nature des programmes immobiliers concernés. Là aussi, un algorithme permet de repérer les valeurs extrêmes, sujettes à caution, facilitant le travail de l’expert.
Un résultat à valeur plus référentielle que statistique
Pour les opérations immobilières dont les valeurs foncières peuvent être ainsi authentifiées, les informations produites s’avèrent très utiles. Il devient possible de fournir des références incontestables là où les méthodes d’estimation précédemment utilisées, dites à rebours, conduisaient à des résultats approximatifs.
L’apport des DVF est en revanche plus discutable pour la production de données statistiques à l’échelle de territoires ou de typologies d’opérations, car le nombre de données exploitables n’est pas toujours suffisant.
En effet, malgré nos efforts, une part non négligeable des valeurs foncières liées à la production de logements neufs reste inexploitable. Une raison importante tient à la limitation temporelle de l’ouverture des DVF, déjà évoquée. Aujourd’hui, seules les opérations neuves réalisées en un maximum de cinq ans, entre les premières acquisitions foncières et les dernières ventes d’appartements, peuvent être intégralement « tracées » dans la base des DVF. Certes, la base s’enrichit tous les six mois des transactions du dernier semestre. Mais, à ce rythme, il faudrait attendre cinq ans pour disposer de données offrant un recul de dix ans, plage de temps qui nous semble nécessaire pour documenter la quasi-totalité des opérations immobilières récemment commercialisées ou en cours.
Un autre facteur limitant doit être signalé. Nos propres données s’appuient en partie (seulement) sur la base Sitadel des demandes et attributions de permis de construire, laquelle est très loin d’être exhaustive – le fait est notoire. En outre, quand les permis de construire sont effectivement enregistrés, il n’est pas rare que la référence cadastrale, seule donnée qui nous permette de croiser nos bases avec celle des DVF, soit inexacte ou manquante.
Des obstacles à lever pour libérer le potentiel des DVF
À ce stade, la question qui se pose est la suivante : devons-nous nous contenter de produire des informations de référence sur les marchés immobiliers, qui ont certes leur utilité pour les opérateurs, ou devons-nous tenter de lever les obstacles qui s’opposent à une exploitation statistique des données de DVF ? À notre sens, l’ouverture des données de DVF est un événement potentiellement majeur. A l’évidence, une transparence accrue sur les valeurs foncières réelles ferait obstacle à la spéculation et à ses effets inflationnistes sur les prix des logements. Pouvoir suivre en temps (quasi) réel les variations des valeurs foncières sur les territoires serait également très utile pour ajuster les politiques publiques et faire porter les efforts là précisément où ils seront le plus efficaces. C’est pourquoi nous plaidons pour une ouverture augmentée des DVF, qui s’étende aux transactions d’une dizaine d’années écoulées, et dont les règles d’anonymisation seraient allégées en levant le secret sur les régimes fiscaux des transactions. Nous estimons que ces deux mesures, toutes choses égales par ailleurs c’est-à-dire sans amélioration notable de Sitadel, devraient permettre d’élever le taux de qualification des données de DVF de moins de 60 % actuellement à plus de 75 %, seuil à atteindre pour une exploitation statistique des DVF dans le cadre de la production de logements neufs.
Article co-rédigé avec Laurent Escobar, directeur général adjoint au développement, associé d’Adequation, et Guillaume Houllemare, directeur de marché EXPLORE.
Publication dans Etudes Foncières Octobre 2020. N°177 p33-34
* Favoriser le développement d’un écosystème d’innovation autour de l’open data du foncier, paru dans études foncières n°174 de juillet 2017. Par Laurent Escobar, directeur associé d’Adequation, et Laurent Nicouleau, directeur associé d’EXPLORE