Foire aux questions

Chercher le chemin, c’est souvent commencer par poser les bonnes questions

Informations générales

DATAtourisme est un dispositif national visant à faciliter l’accès aux données d’information touristique produites à travers les territoires. Il se matérialise par un système d’agrégation et de diffusion de données en open data, directement reliée aux bases de données territoriales, et repose sur l’animation d’une communauté d’utilisateurs.

1. Aux producteurs de données

Les Offices de tourisme, CDT, CRT et autres organismes autorisés disposent de :

  • La plateforme producteur https://producteur.datatourisme.fr dédiée à l’alimentation du dispositif national en données touristiques ;
  • Une plateforme qualité https://qualite.datatourisme.fr , destinée à accompagner les OGD dans la fiabilisation, l’enrichissement et l’amélioration continue des données qu’ils produisent.

Ces outils sont réservés aux Ces outils sont réservés aux personnes physiques ou morales habilitées à contribuer à la base nationale.

2. Aux utilisateurs de la données (startups, médias, citoyens etc.)

Les acteurs souhaitant exploiter les données (startups, médias, collectivités, entreprises, chercheurs…) peuvent accéder aux données via :

3. Au grand public

Une plateforme de consultation et d’exploration des données est également disponible :

Elle permet de découvrir le contenu de la base nationale et de valoriser concrètement la richesse des données touristiques produites par les territoires.

DATAtourisme est piloté par ADN Tourisme, la fédération nationale des organismes institutionnels du tourisme. Elle regroupe notamment les offices de tourisme et relais territoriaux, les agences de développement ainsi que les comités départementaux et régionaux du tourisme. Le dispositif est animé par la commission Data & Innovation en lien étroit avec un comité technique.

  • La plateforme reçoit et agrège des jeux de données publiques en provenance de plus de 40 bases de données touristiques territoriales ;
  • Une fois collectées, les données sont normalisées dans un format et un vocabulaire unique et stockées sur la plateforme DATAtourisme ;
  • Les données sont mises à disposition en Open Data sous Licence Ouverte (Etalab 2.0).

DATAtourisme repose sur un modèle souverain car il s’appuie sur une gouvernance publique, un standard ouvert et une infrastructure indépendante de tout éditeur privé.

L’ontologie, les formats de données et les règles de diffusion sont publics, documentés et librement réutilisables, garantissant l’absence de verrou propriétaire.

Ce modèle permet aux territoires de conserver la maîtrise de leurs données, d’assurer leur réversibilité et de favoriser une réutilisation large, y compris par des acteurs privés ou des solutions d’IA, sans dépendance technologique ni commerciale.

Les données agrégées sur la plateforme DATAtourisme proviennent des réseaux et systèmes d’information touristique (SIT). Il s’agit des bases de données publiques gérées par les organismes institutionnels en charge du tourisme. Ces bases de données sont alimentées par les Offices de Tourisme, les Agences départementales et les Comités Régionaux du Tourisme. Il existe plus de 40 bases de données « SIT » réparties sur le territoire national.

Non, la plateforme DATAtourisme n’est pas un SIT : il n’est notamment pas possible d’y saisir (produire) de l’information directement et elle ne répond pas aux mêmes objectifs.

La plateforme DATAtourisme est alimentée par les SIT : elle se positionne comme un canal de diffusion national unique entre les bases de données territoriales et les ré-utilisateurs finaux, dans un objectif d’agrégation, de normalisation et de mise en open data des informations touristiques à plus large échelle. La plateforme DATAtourisme  et les SIT (ou réseaux) territoriaux sont donc des outils complémentaires.

Non. DATAtourisme a été conçu en complémentarité avec les SIT et réseaux d’information touristique existants (Apidae, Sitlor, SIRTAQUI, etc.).

Les SIT restent les outils du quotidien des territoires : ils servent à produire, enrichir et exploiter la donnée touristique pour la promotion, l’accueil des visiteurs et le pilotage des politiques locales.

La mission de DATAtourisme est différente : rassembler ces données au sein d’un entrepôt national, afin d’en faciliter la réutilisation par des tiers, tout en offrant aux territoires une solution mutualisée pour répondre aux obligations d’ouverture des données publiques.

L’utilisation de la plateforme DATAtourisme est gratuite pour tous les utilisateurs.

L’interface diffuseur est actuellement disponible en français et en anglais. L’ontologie DATAtourisme est traduite en anglais, espagnole, allemand, italien et néerlandais.

Les données disponibles

La plateforme DATAtourisme diffuse des données d’information relatives au recensement et à la description de points d’intérêts et d’événements à caractère « touristique » :

  • Evénements: culturels (concert, exposition, festival…), sociaux (carnaval, fête traditionnelle…), commerciaux (marché, foire, …), sportifs (compétitions, démonstrations…)
  • Lieux: sites culturels (musée, bâtiment civil, …), sites naturels (lac, falaise, point de vue…), restaurants, hébergements, transport (parking, gare, station de transport en commun…), commerces, services pratiques (bornes de service pour camping-car, loueurs de vélo, …)
  • Produits : toutes les prestations immatérielles telles que les visites, stages, activités touristiques… 
  • Itinéraires : parcours composés de plusieurs étapes.

A noter : certains POI peuvent être répertoriés dans plusieurs catégories. Par exemple, un musée sera répertorié en tant que lieu, mais aussi en tant que produit si son tarif est renseigné (car il s’agit aussi dans ce cas d’une activité de visite).

La liste exhaustive des catégories recensées au sein de la plateforme DATAtourisme est disponible dans la documentation de l’ontologie.

Oui et non. Les SIT utilisent des formats, vocabulaires et catégories propres à chaque territoire. DATAtourisme collecte ces mêmes données, les homogénéise et les normalise, puis les met à disposition en open data, sous un format et une licence différents.

Certaines données des SIT n’ont toutefois pas vocation à être intégrées à DATAtourisme, notamment celles soumises au droit d’auteur ou hors périmètre de la plateforme nationale.

Non. La plateforme DATAtourisme délivre uniquement des données relatives au recensement et à la description d’événements et de points d’intérêt touristiques. Les données de fréquentation ou plus largement de statistiques, ne font pas partie du périmètre actuel du dispositif DATAtourisme.

Certains points d’intérêt touristiques disponibles sur la plateforme DATAtourisme contiennent un ou plusieurs liens hypertexte permettant d’accéder à des images. C’est le cas lorsque les images sont elles-mêmes des données publiques soumises au cadre législatif de l’open data ou lorsque le producteur du point d’intérêt publié dispose des droits adaptés à une diffusion en open data de l’image associée à celui-ci. Dans ce cas, le diffuseur peut utiliser les urls présentes dans les données de la plateforme pour télécharger et réutiliser les images associées aux POI, dans le respect strict de la Licence Ouverte 2.0 et de la réglementation relative aux droits d’auteurs et aux droits voisins.

Il convient toutefois de noter que la plateforme DATAtourisme n’a pas pour vocation d’être une photothèque touristique et que la présence d’images d’illustration de points d’intérêt reste limitée.

Les points d’intérêt sont décrits selon les critères définis dans l’ontologie. De nombreux critères de description sont proposés, parmi lesquels certains seront systématiquement disponibles :

  • Titre ou nom du point d’intérêt
  • Catégorie (concert, musée, plage…)
  • Géolocalisation : latitude + longitude
  • Code INSEE
  • Adresse postale
  • Une date de début et de fin (pour les évènements)
  • Désignation du fournisseur de l’information
  • Date de mise à jour des informations

D’autres critères viendront compléter la description de certains points d’intérêt :

  • Description en langues étrangères
  • Moyens de communication : web, téléphone, mail
  • Thème(s) et audience(s)
  • Informations tarifs / gratuité
  • Marques et labels
  • URL vers la réservation
  • Equipements et services
  • Langues parlées sur place
  • Liens vers des images / photos

Les données sont disponibles par défaut en français. Elles sont également accessibles en anglais, allemand, espagnol, italien et néerlandais.

Les flux de données en provenance des Systèmes et Réseaux d’information touristique locaux, collectées au sein de la plateforme DATAtourisme, sont mis à jour quotidiennement. A la source, les producteurs mettent à jour au moins une fois par an les informations relatives aux catégories LIEUX, PRODUITS, ITINERAIRES. De nouvelles données de type EVENEMENTS sont ajoutées ou modifiées quotidiennement en fonction des programmations locales.

L’ensemble des producteurs alimentant la plateforme DATAtourisme s’engage à faire ses meilleurs efforts pour diffuser uniquement des données dites « fiables et à jour », respectant les termes de la charte qualité DATAtourisme. Un référentiel qualité a également été conçu avec le comité technique.

Oui, chaque point d’intérêt mis à disposition depuis la plateforme est géolocalisé par les critères longitude + latitude (WGS84 – coordonnées GPS).

Oui. Toutefois chaque producteur garde la main sur ses données et décide du rythme et du périmètre des informations touristiques qu’il souhaite diffuser en Open Data sur la plateforme DATAtourisme. La couverture géographique du territoire nationale évolue régulièrement, de même que la quantité de données au sein d’un même territoire.

Les points d’intérêt sont décrits selon les critères définis dans l’ontologie. La liste des critères obligatoires constitue un socle commun à toutes les données. En complément, les producteurs peuvent qualifier davantage les informations avec des critères complémentaires, en fonction des informations disponibles dans leur Système ou Réseau d’information touristique et de leur adéquation avec la Charte qualité du dispositif DATAtourisme.

Le créateur de chaque point d’intérêt est identifié par la propriété HasBeenCreatedBy.

Grâce à l’ontologie, essentiellement basée sur des normes internationales telles que Schema.org et Foaf, l’interopérabilité des données issues de la plateforme DATAtourisme est optimale.

Producteurs et utilisateurs de la donnée

La version actuelle de la plateforme DATAtourisme peut être alimentée exclusivement par les organismes institutionnels chargés de collecter l’information touristique locale au sein d’un Système ou Réseau d’Information Touristique local. Il s’agit des Offices de Tourisme (OT), Agences et Comités Départementaux du Tourisme (ADT), et Comités Régionaux du Tourisme (CRT) mais également de tout autre producteur de données touristiques publiques œuvrant à l’échelle territoriale ou nationale.

Pour le moment, seuls les producteurs de données institutionnels peuvent diffuser leurs informations via le dispositif DATAtourisme. Cependant, il n’est pas exclu que la plateforme puisse s’ouvrir à d’autres acteurs issus du secteur privé dans un second temps.

Les données sont accessibles à tous sans discrimination (citoyen, start-up, entreprise, collectivité, association) à condition de respecter les termes de la Licence Ouverte.

Non, pas systématiquement.

  • Sur la plateforme diffuseur : la création d’un compte est nécessaire pour paramétrer et administrer des flux de données via l’interface dédiée.
  • Via l’API DATAtourisme : nécessite une inscription minimale distincte (nom, prénom, adresse email et acceptation des CGU) afin d’obtenir une clé API.

Il s’agit donc de deux inscriptions différentes, correspondant à des usages distincts.

Les données consommées via la plateforme Explore (export iframe ou CSV) ou sur le portail www.data.gouv.fr (RDF-NT ou CSV) ne nécessitent pas de création de compte.

Conformément aux Conditions Générales d’Utilisation de la plateforme DATAtourisme, les données de profil des utilisateurs de la plateforme diffuseurs ainsi que de l’API sont collectées sur la base du consentement de ces derniers, recueilli lors de la création du compte. Les données de profil sont accessibles aux administrateurs de la plateforme et aux prestataires techniques chargés de la maintenance de celle-ci.

Elles sont utilisées pour les finalités suivantes :

  • La gestion du compte du diffuseur ;
  • La gestion du compte du diffuseur ;
  • La gestion des demandes de support technique ;
  • La gestion des demandes de droit d’accès, de rectification et d’opposition ;
  • la publication de statistiques sur la plateforme et, notamment, sur l’interface utilisable par les producteurs (catégories de données téléchargées par le diffuseur, fréquences des téléchargements etc.)

Les données à caractère personnel présentes dans les informations de profil ne sont en aucun cas diffusés.

  • Sur la plateforme diffuseur : les données de profil peuvent être modifiées à tout moment par l’utilisateur grâce à l’interface « Mon profil »
  • Sur l’API : la demande peut être effectuée sur demande à contact@datatourisme.fr

Un utilisateur peut demander la fermeture de son compte sur la plateforme diffuseur ou la révocation de sa clé d’API auprès de l’administrateur, en justifiant de son identité :

  • Par courrier à l’adresse : ADN Tourisme – 82 avenue du Maine 75014 Paris ;
  • Sur demande à contact@datatourisme.fr

L’utilisateur reçoit un courrier électronique d’alerte préalablement à toute fermeture de compte. Le compte est ensuite supprimé par un administrateur de la plateforme DATAtourisme dans un délai raisonnable.

A noter : la suppression du compte est irréversible et implique la perte de l’ensemble des données, informations et avantages conférés par la plateforme DATAtourisme. Il incombe au diffuseur de prendre à sa charge les mesures nécessaires pour conserver ses données s’il le souhaite.

Fonctionnement et accès aux données

Il existe à ce jour trois moyens d’accéder aux données :

La plateforme Explore offre une manière simple et intuitive de parcourir la donnée touristique. Elle permet de visualiser les informations sur une carte ou sous forme de liste, de créer des vues personnalisées et de les partager facilement via une iframe. Les utilisateurs peuvent également exporter les résultats au format CSV pour les exploiter dans leurs propres outils. Aucune création de compte n’est demandée.

L’API web permet de consommer la donnée en temps réel. L’accès à l’API DATAtourisme nécessite une inscription minimale (nom, prénom, adresse email) afin de délivrer une clé API et d’en assurer la gestion.

La plateforme diffuseur offre aux utilisateurs la possibilité de créer des flux sur-mesure au moyen de plusieurs écrans de paramétrage. Les paramètres disponibles permettent de choisir les caractéristiques techniques du flux, mais aussi de sélectionner les caractéristiques des données souhaitées (catégories, thèmes, périodes…). La création d’un compte diffuseur est donc nécessaire pour pouvoir paramétrer chaque flux souhaité et les administrer.

A noter : un dépôt global des données issues de la plateforme DATAtourisme est proposé sans enregistrement préalable sur le portail www.data.gouv.fr. L’utilisateur aura accès aux données sous Licence Ouverte et au format RDF-NT, ainsi qu’à une version simplifiée au format CSV.

Le paramétrage d’un flux personnalisé est nécessaire pour pouvoir accéder aux données. Pour procéder à ce paramétrage, le diffuseur doit cliquer sur le bouton « Nouveau flux » et suivre la procédure détaillée dans la documentation.

Lors du paramétrage d’un flux de données, l’éditeur visuel de requête permet au diffuseur de sélectionner le périmètre géographique des données souhaitées.

Pour cela, le diffuseur doit activer le filtre « Est localisé à » puis « a pour adresse postale », et précisez le périmètre souhaité en sélectionnant les filtres complémentaires :

  • a comme localité / recherche par thésaurus (pour une recherche par localité)
  • a comme localité / fait partie du département / recherche par thésaurus (pour une recherche par département)
  • a comme localité / fait partie du département / fait partie de la région / recherche par thésaurus (pour une recherche par région)

A noter qu’il est également possible de définir un périmètre géographique selon une zone tracée ou selon une latitude / longitude.

Lors du paramétrage d’un flux de données, l’éditeur visuel de requête permet au diffuseur de sélectionner la ou les catégories de données souhaitées :

pour filtrer davantage et accéder aux 3è et 4è niveaux de catégories (concert, point de vue, chambre d’hôtes…), activez en complément le filtre « TYPE » (autocomplétion) qui permet d’accéder aux niveaux inférieurs via une liste déroulante.

la liste déroulante « Type de points d’intérêt » permet de sélectionner les données selon les deux premiers niveaux de catégories

Le flux mis à disposition du diffuseur est compressé pour économiser la bande passante (encodage GZIP). Lorsqu’il est téléchargé au moyen d’un navigateur, ce dernier procède automatiquement à la décompression du fichier. Dans les autres cas, le diffuseur doit faire le nécessaire pour paramétrer la décompression.

Les clés API sont à ce jour distribuée gratuitement sur demande en remplissant le formulaire dédié.

L’API est accessible via son environnement de production : https://api.datatourisme.fr

Et pour vous accompagner :
• Une documentation simplifiée: https://api.datatourisme.fr/v1/docs
• Une documentation complète (Swagger) : https://api.datatourisme.fr/v1/swagger

Les règles de quotas à date sont les suivantes :

  • Limite de 1000 requêtes/heure
  • Maximum 20 à 30 requêtes concurrentes par client,
  • Pas plus de ~10 requêtes/seconde de manière prolongée,

La plateforme explore permet d’exporter de la donnée sous format CSV. Elle dispose également d’un module d’intégration iframe personnalisé pour vos supports numériques.

Format des données

Oui. Les données sont structurées et documentées selon une ontologie dédiée. Ce modèle, dit sémantique, présente un concept racine qui est PointOfInterest (abrégé POI) sur lequel se greffent ses caractéristiques. Par exemple, un POI contiendra toujours une propriété « Date de dernière mise à jour » qui sera toujours diffusé au format AAAA-MM-JJ. Toutes les caractéristiques définissant un POI, mais aussi l’ensemble des valeurs possibles pour chaque caractéristique, lorsqu’elles sont limitées à une liste (principe de thésaurus, ou base de connaissances), sont décrites dans la documentation de l’ontologie.

Elles peuvent aussi être visualisées sous forme de graphe.

Une ontologie est un modèle commun qui décrit les concepts d’un domaine et leurs relations, afin de rendre les données compréhensibles et exploitables par les machines.

L’ontologie nationale, créée en 2015 sous l’égide de l’État, est le modèle de données qui structure l’ensemble des informations touristiques diffusées par la plateforme. Elle s’appuie sur des standards reconnus (Schema, Dublin Core, FOAF, GoodRelations…) et couvre l’ensemble des points d’intérêt touristiques : sites, événements, activités, itinéraires, hébergements, restaurants, commerces et services.

Elles peuvent aussi être visualisées sous forme de graphe.

Les données DATAtourisme sont diffusées dans ce format standardisé et sémantique.

Les données sont décrites selon la base de connaissance DATAtourisme associée à l’ontologie nationale. L’ensemble des valeurs possibles est disponible dans la documentation (fichier « Thésaurus »).

Les données DATAtourisme sont structurées selon un modèle sémantique (ontologie + triplets RDF), ce qui les rend directement exploitables par des outils d’intelligence artificielle, notamment pour la recherche, la recommandation, la contextualisation ou la génération de contenus.

Cette structuration explicite des concepts et de leurs relations facilite l’interprétation des données par les machines, limite les ambiguïtés et améliore la qualité des traitements automatisés.

Les données DATAtourisme sont décrites selon un format sémantique, basé sur un graphe RDF : elles ne sont donc pas représentées « à plat », mais sous forme de triplets RDF identifiés par des URI, quel que soit le format de diffusion.

La plateforme permet de télécharger les données dans plusieurs formats (XML, CSV, JSON, SQL, RDF-XML, Turtle, NT, HDT, etc.), correspondant à différentes syntaxes de sérialisation d’un même modèle de données.

Des versions CSV simplifiées sont également disponibles sur la plateforme Explore ou via data.gouv.fr, avec un niveau de description plus limité.

Une base de données RDF est composée de triplets, qui constituent l’unité élémentaire de description d’une information. Un triplet RDF associe trois éléments : un sujet, un prédicat et un objet.

  • Le sujet : représente la ressource à décrire (par exemple un site touristique) et est identifié par un IRI.
  • Le prédicat : représente une propriété de cette ressource (par exemple a pour nom, est localisé à). Ces propriétés sont définies par l’ontologie, qui fixe leur sens et leur usage.
  • L’objet : est la valeur de cette propriété : soit une autre ressource, soit un littéral (texte, date, etc.).

L’ontologie fournit le vocabulaire et les règles, tandis que les triplets RDF sont les phrases concrètes qui utilisent ce vocabulaire pour décrire les données. L’ensemble des triplets forme ainsi un graphe de données structuré et interopérable.

Conditions d’utilisation

L’utilisation de la plateforme diffuseur et de l’API DATAtourisme est soumise à l’acceptation de Conditions Générales d’Utilisation. Aucune condition n’est requise pour la plateforme Explore.

Les producteurs concèdent aux diffuseurs un droit non exclusif et gratuit des données dans des conditions exprimées par la Licence Ouverte 2.0.

Un usage commercial est possible à condition de respecter les termes de la Licence Ouverte 2.0.

Les diffuseurs ou réutilisateurs de données doivent respecter les termes de la Licence Ouverte 2.0 et notamment mentionner la paternité des données ainsi la date de dernière mise à jour de celles-ci.

Pour ce faire, il est demandé aux diffuseurs d’exploiter les propriétés « HasBeenCreatedBy » et « LastUpdate ».

Cependant, si la mention d’une paternité propre à chaque donnée n’est pas possible immédiatement (projet expérimental ou bêta test par exemple), l’intégration d’une mention globale est temporairement tolérée, selon le modèle suivant :

« Données originales téléchargées sur la plateforme DATAtourisme, alimentée par un collectif de producteurs Date de dernière mise à jour : JJ/MM/AAAA ».

La date de dernière mise à jour correspondra alors à la date de mise à jour du flux exploité par le diffuseur, et non à la date de mise à jour issue du champ « LastUpdate », disponibles dans les flux mis à disposition.

Il est demandé à tout diffuseur des données issues de DATAtourisme, de se conformer au plus vite à ces règles d’utilisation dans leur version complète (exploitation des champs « HasBeenCreatedBy » et « LastUpdate »), la solution d’une mention unique et globale ne pouvant être que temporaire. L’équipe DATAtourisme est susceptible de prendre contact avec les responsables des sites ne respectant pas les termes de la Licence Ouverte afin de demander expressément l’ajout de ces mentions. Après relance sans succès, le(s) flux DATAtourisme du-dit diffuseur pourront être bloqués et, le cas échéant, le compte de l’utilisateur pourra être supprimé, conformément aux termes des Conditions Générales d’Utilisation de la plateforme.

Les photos disponibles sur la plateforme DATAtourisme sont mises à disposition selon les termes de la Licence Ouverte 2.0, au même titre que les autres données disponibles. Il s’agit de données dites publiques, ou dont les droits d’utilisation sont alignés sur ceux de la Licence Ouverte.

Conformément à la règlementation sur les droits d’auteur, toute réutilisation de photos disponibles sur la plateforme devra être accompagnée d’une mention des informations de crédits photographiques (propriété :Credits) et devra respecter les dates de cession de droits d’utilisation  ( :rightsStartingDate et :rightsEndingDate).

Contact et assistance

Voici les liens vers les différentes ressources du dispositif DATAtourisme :

Merci de bien vouloir envoyer une présentation de votre projet (pitch, dossier détaillé, captures écran, vidéo…) par courrier électronique à l’adresse contact@datatourisme.fr En fonction de l’avancement du projet présenté et à sa libre appréciation, le comité de pilotage DATAtourisme pourra vous recontacter afin de vous proposer de relayer des informations sur ses supports de communication ou réseaux sociaux.

Actuellement, nous ne proposons pas de formation à l’utilisation de la plateforme DATAtourisme. Nous vous invitons à vous référer aux documentations mises à disposition.