Dans le cadre de ce module d’analyse de donnĂ©es, vous allez vous intĂ©resser Ă  une nouvelle approche du traitement des donnĂ©es, la “Data Visualisation”.

C’est quoi, une dataviz ?

Une dataviz, ou visualisation de donnĂ©es, consiste Ă  transformer des donnĂ©es brutes en une reprĂ©sentation visuelle — carte, graphique, tableau de bord ou schĂ©ma — pour rendre visible ce qui, autrement, resterait abstrait. Elle sert Ă  faire parler les donnĂ©es, Ă  dĂ©tecter des tendances ou des anomalies, et Ă  comprendre en quelques secondes ce qu’un tableau de chiffres mettrait des pages Ă  exprimer.

Dans le domaine du tourisme, une dataviz permet par exemple de visualiser d’oĂč viennent les touristes, Ă  quelles pĂ©riodes de l’annĂ©e ils voyagent, combien de nuitĂ©es ils effectuent ou encore dans quels dĂ©partements ils sĂ©journent le plus. En un coup d’Ɠil, elle offre une lecture immĂ©diate de phĂ©nomĂšnes complexes : la saisonnalitĂ©, les comportements de dĂ©placement, ou la rĂ©partition gĂ©ographique de la frĂ©quentation.

https://www.anychart.com/blog/wp-content/uploads/2019/08/Routitude.png
https://www.researchgate.net/publication/307773197/figure/fig1/AS%3A610332959592458%401522526125659/Flow-Map-International-Tourist-Movements-to-Langkawi-in-2010.png

Mais la dataviz n’est pas qu’un outil de synthĂšse : c’est une vĂ©ritable forme de rĂ©cit visuel. Elle raconte une histoire Ă  partir des donnĂ©es, comme un reportage chiffrĂ© oĂč chaque graphique illustre une idĂ©e. En cela, elle dĂ©passe la simple prĂ©sentation statistique pour devenir un outil de comprĂ©hension et de dĂ©cision. Les chiffres cessent d’ĂȘtre des entitĂ©s froides pour devenir les acteurs d’une narration : celle du territoire, de ses visiteurs et de son Ă©volution.

La visualisation permet de dépasser les chiffres « nus » pour devenir un outil de décision, un « récit visuel ».

Changements d’occupation des sols à Sóller (1990–2018) : carte et graphiques CORINE Land Cover
Source : CORINE Land Cover (1990–2018). Visualisation : changement d’occupation des sols à Sóller (Majorque).

Cette dataviz illustre comment un territoire peut ĂȘtre racontĂ© visuellement. À partir des donnĂ©es du programme CORINE Land Cover (1990–2018), elle montre l’évolution de l’occupation des sols Ă  SĂłller, sur l’üle de Majorque. En un regard, on perçoit trois dynamiques : une urbanisation en forte hausse (+181 ha), un recul marquĂ© des terres agricoles (–802 ha) et une progression des zones forestiĂšres et naturelles (+618 ha). Les graphiques et la carte combinĂ©s permettent de comprendre que le paysage se transforme : l’espace urbain s’étend, l’agriculture rĂ©gresse et la forĂȘt regagne du terrain. Cette visualisation illustre la puissance de la dataviz : elle fait voir une tendance, une tension et une histoire territoriale, sans nĂ©cessiter de longues explications.

🎯 Pourquoi c’est utile (et pourquoi pour vous)

Pour les Ă©tudiants en tourisme, la dataviz est avant tout un langage visuel qui permet de montrer plutĂŽt que de simplement dĂ©crire. Dire que la frĂ©quentation baisse en hiver est une affirmation ; le montrer avec une courbe saisonniĂšre rend cette rĂ©alitĂ© tangible. La dataviz vous apprend donc Ă  communiquer efficacement une observation et Ă  donner Ă  vos interlocuteurs les moyens de la comprendre instantanĂ©ment. C’est un outil de diagnostic, mais aussi de persuasion.

Pour les Ă©tudiants en technologies de l’information et de la communication, la dataviz reprĂ©sente une application concrĂšte de vos compĂ©tences numĂ©riques. Elle permet de manipuler des jeux de donnĂ©es rĂ©elles, d’utiliser des outils de traitement et de visualisation comme Excel, Power BI ou Python, et d’en tirer un rĂ©sultat immĂ©diatement interprĂ©table. Contrairement Ă  des exercices purement techniques, ici la donnĂ©e prend sens dans un contexte mĂ©tier rĂ©el : celui du tourisme rĂ©gional et de ses enjeux Ă©conomiques, sociaux et environnementaux.

Dans vos futurs mĂ©tiers, cette compĂ©tence fera la diffĂ©rence. Les acteurs du tourisme — offices, agences, collectivitĂ©s, chaĂźnes hĂŽteliĂšres, gestionnaires de destinations — utilisent de plus en plus la visualisation pour orienter leurs dĂ©cisions. Les donnĂ©es de frĂ©quentation, de satisfaction, de mobilitĂ© ou de durabilitĂ© sont dĂ©sormais au cƓur des stratĂ©gies. Une dataviz claire et pertinente peut influencer un choix d’investissement, guider une politique de communication, ou rĂ©vĂ©ler un potentiel inexploitĂ©.

Savoir concevoir une visualisation de donnĂ©es, mĂȘme simple, vous rendra donc plus autonomes dans l’analyse, plus crĂ©dibles dans vos argumentations et plus attractifs sur le marchĂ© du travail. Vous serez capables non seulement de lire les chiffres, mais aussi de les interprĂ©ter, de les traduire et de les mettre en rĂ©cit. C’est exactement ce que les entreprises recherchent aujourd’hui : des professionnels capables de donner du sens Ă  l’information.

Objectif du challenge

Votre objectif consistera Ă  analyser, en Ă©quipe, un jeu de donnĂ©es et Ă  raconter une histoire avec des graphiques Ă  partir d’un jeu de donnĂ©es original comme vous le feriez pour un concours de “Data Visualisation” (ou “DataViz”).

Cette activitĂ© va vous amener Ă  comprendre comment les donnĂ©es façonnent les reprĂ©sentations du tourisme et comment leur visualisation peut devenir un levier stratĂ©gique. À travers ce challenge, vous allez dĂ©velopper une compĂ©tence recherchĂ©e : la capacitĂ© Ă  traduire des donnĂ©es en dĂ©cisions, Ă  relier des faits Ă  des enjeux concrets, et Ă  construire une narration qui donne envie d’agir.

Ne cherchez pas Ă  faire de grandes dĂ©monstrations “mathĂ©matiques” mais plutĂŽt Ă  raconter une histoire comprĂ©hensible et intĂ©ressante pour tou(te)s. Accordez donc une importance particuliĂšre Ă  cette “histoire”, que vous allez raconter, et au design de vos graphiques et supports.

Vous ne produirez pas seulement des graphiques : vous Ă©crirez, avec des chiffres et des couleurs, une histoire du tourisme en Occitanie. Une histoire rigoureuse, mais vivante. Une histoire qui, comme le territoire qu’elle raconte, invite Ă  la dĂ©couverte.

Descriptif du challenge

🌍 Raconter le tourisme en Occitanie Ă  travers les donnĂ©es

Chaque chiffre raconte une histoire. DerriĂšre les millions de nuitĂ©es, les flux de visiteurs, les pics de frĂ©quentation ou les variations saisonniĂšres, il y a des comportements, des choix, des envies humaines. Le tourisme n’est pas seulement une sĂ©rie de statistiques : c’est un mouvement vivant, celui des personnes qui voyagent, dĂ©couvrent, reviennent, consomment, ou choisissent de rester. En donnant vie Ă  ces chiffres, la dataviz permet de raconter le territoire autrement, d’en dĂ©voiler les rythmes et les contrastes.

L’Occitanie est une rĂ©gion d’une richesse exceptionnelle. Des plages de la MĂ©diterranĂ©e aux cimes des PyrĂ©nĂ©es, des villages du Gers aux mĂ©tropoles de Toulouse et Montpellier, elle offre une diversitĂ© rare. Pourtant, cette diversitĂ© ne se lit pas toujours dans les discours : elle se dĂ©couvre dans les donnĂ©es. En Ă©tudiant les flux touristiques, on comprend que le tourisme n’est pas uniforme. Certains dĂ©partements attirent une clientĂšle internationale, d’autres vivent du tourisme local ou saisonnier. Certains espaces sont saturĂ©s en Ă©tĂ©, d’autres conservent une frĂ©quentation stable toute l’annĂ©e. Les donnĂ©es permettent de visualiser ces dynamiques et d’en tirer des enseignements concrets.

Raconter le tourisme en Occitanie Ă  travers les donnĂ©es, c’est aussi mettre en lumiĂšre les tendances qui se cachent derriĂšre les moyennes. Par exemple, une hausse globale du nombre de visiteurs peut masquer des rĂ©alitĂ©s opposĂ©es : une forte croissance sur le littoral, mais un dĂ©clin dans l’arriĂšre-pays. GrĂące Ă  la dataviz, ces nuances deviennent visibles. Vous pouvez montrer comment les Ă©vĂ©nements culturels, la mĂ©tĂ©o, ou les politiques locales influencent la frĂ©quentation. Vous pouvez aussi rĂ©vĂ©ler les Ă©volutions de long terme : la montĂ©e du tourisme durable, l’impact du transport ferroviaire, ou la redĂ©couverte du tourisme de proximitĂ© depuis la crise sanitaire.

L’intĂ©rĂȘt de ce travail est double : il est analytique et crĂ©atif. Analytique, car vous allez apprendre Ă  explorer des jeux de donnĂ©es rĂ©els sur le tourisme en Occitanie : frĂ©quentation hĂŽteliĂšre, hĂ©bergements, provenance des visiteurs, conditions mĂ©tĂ©orologiques, Ă©vĂ©nements, etc. CrĂ©atif, car vous devrez transformer ces chiffres en un rĂ©cit visuel que chacun peut comprendre, sans jargon statistique. Votre mission n’est pas de “faire des calculs”, mais de faire parler les chiffres pour qu’ils deviennent un outil de comprĂ©hension du territoire.

Raconter le tourisme par la donnĂ©e, c’est enfin prendre position en tant qu’observateur et interprĂšte. Vous allez choisir un angle, poser des hypothĂšses, croiser des informations. Ce choix est essentiel : il montre que derriĂšre la visualisation, il y a une rĂ©flexion. Vous ne cherchez pas Ă  prouver, mais Ă  comprendre. Vous ne cherchez pas Ă  convaincre, mais Ă  faire voir autrement.

Le tourisme dans la région Occitanie en 2018

Tout au long de l’annĂ©e, des milliers de touristes dorment dans notre belle rĂ©gion.

Vous trouverez ici un jeu de données unique qui les localise et les compte par nuitée.
Vous connaissez :

  • Les capacitĂ©s d’hĂ©bergement (hĂŽtel, camping,..) de chaque dĂ©partement
  • La provenance des touristes, que ce soit d’un dĂ©partement Français ou de l’étranger
  • Le temps qu’il faisait et les principaux Ă©vĂ©nements culturels pour chaque journĂ©e

Quelques rĂšgles du jeu

  • Vous pouvez utiliser tous les outils qu’ils souhaitent pour explorer ces donnĂ©es et en proposer une reprĂ©sentation visuelle Ă  base de graphique tels que Excel, SPSS, PSPP, Tableau (https://www.tableau.com/), Observabke HQ (https://observablehq.com/) et toutes les bibliothĂšques Python ainsi que tout support de prĂ©sentation de vos rĂ©sultats tels que PowerPoint, Canva, Adobe PDF… 
  • Vous devez fournir la liste des outils utilisĂ©s pour la rĂ©alisation des graphiques
  • Vous pouvez utiliser tout type d’outil d’analyse de donnĂ©es tels que 
  • Vous pouvez effectuer tous types de calcul Ă  partir de ce jeu de donnĂ©es
  • Le format de restitution de cette analyse visuelle est laissĂ© Ă  votre libre choix. Vous pouvez utiliser un format pdf (Ă©quivalent de 2 pages A4) aussi bien qu’un site web (Ă©quivalent de 3 captures d’écran) ou des reprĂ©sentations avec PowerBI, Tableau ou d’autres logiciels d’analyse et de reprĂ©sentation.
  • Vous ajouterez tous les Ă©lĂ©ments contextuels nĂ©cessaires pour commenter le ou les graphiques.
  • Vous n’ĂȘtes pas dans l’obligation d’utiliser toutes les donnĂ©es.
  • Hormis des fonds de carte, vous n’ĂȘtes pas autorisĂ©(e)s Ă  utiliser d’autres donnĂ©es que celles fournies.

Les données du challenge

Les sources des jeux de données

  • Les volumes de nuitĂ©es ont Ă©tĂ© construites par un opĂ©rateur de tĂ©lĂ©phonie mobile Ă  partir des bornages tĂ©lĂ©phoniques. Ces donnĂ©es ont Ă©tĂ© fournies par le ComitĂ© RĂ©gional du Tourisme (CRT)
  • Les donnĂ©es concernant les capacitĂ©s d’hĂ©bergement ont Ă©tĂ© construites par TDV Ă  partir de donnĂ©es fournies par le ComitĂ© RĂ©gional du Tourisme (CRT).
  • Les donnĂ©es concernant les Ă©vĂ©nements ont Ă©tĂ© construites par TDV Ă  partir de donnĂ©es fournis par le ComitĂ© RĂ©gional du Tourisme (CRT)
  • Les donnĂ©es mĂ©tĂ©o proviennent d’un site internet fournissant l’historique des donnĂ©es mĂ©tĂ©o pour un grand nombre de villes en France et dans le monde
  • Les donnĂ©es de gĂ©omĂ©trie des dĂ©partements sont incluses uniquement dans le fichier geojson. Ce format est adaptĂ© pour ceux qui souhaitent utiliser des outils de cartographie tels que le logiciel libre QGIS ou des librairies javascript telles que d3.js.
  • Les donnĂ©es de bornage tĂ©lĂ©phonique ne sont pas des donnĂ©es brutes mais le rĂ©sultat d’un travail de traitement innovant (redressement, segmentation, anonymisation ) rĂ©alisĂ© par l’opĂ©rateur de tĂ©lĂ©phonie avec la participation d’acteurs du tourisme. Les donnĂ©es “volume de nuitĂ©es” sont donc des estimations statistiques.
  • Les jeux de donnĂ©es sont utilisables dans ce cadre de ce module suite Ă  l’obtention de l’accord de Monsieur Alain Otteinheimer, PrĂ©sident de l’association Toulouse Dataviz, dirigeant de DataSens.

Le descriptif exhaustif des donnĂ©es peut ĂȘtre trouvĂ© sur le dĂ©pĂŽt Github suivant : https://github.com/ToulouseDataViz/Hackaviz2020/blob/master/README.md

Les données comprennent plusieurs fichiers :


Des donnĂ©es synthĂ©tiques et facile d’accĂšs : NuitĂ©es.xls et .CSV

  • 365 lignes et 15 colonnes
  • NuitĂ©es par jour en synthĂšse par dĂ©partement

Le plus dĂ©taillĂ© mais pas le plus simple Ă  exploiter : par_origines.xlsx et .csv

  • 493 235 lignes et 8 colonnes
  • par jour avec tous les dĂ©tails

Croisement capacités x nuités : Sert de complément optionnel aux autres

  • capacites.xlsx, .csv et .geojson
  • 13 lignes et 61 colonnes
  • par semaine en catĂ©gories de nuitĂ©es par dĂ©partement

Il est possible de faire de belles visualisations Ă  partir d’un seul de ces trois fichiers de donnĂ©es, le plus simple Ă©tant nuitees qui est un aggrĂ©gat de par_origines. 

Les plus experts arriveront Ă  combiner les trois, mais il n’est pas certain que la plus belle histoire ait besoin de toutes ces donnĂ©es. 

L’important est de raconter une belle histoire avec des graphiques de qualitĂ©.

DĂ©tails des fichiers et tĂ©lĂ©chargement 

Nuitées

Regroupement des donnĂ©es Ă  partir du fichier par_origines. Pour chaque jour de l’annĂ©e (365 lignes / 15 colonnes)

  • Date
  • Nombre de nuitĂ©es dans le dĂ©partement 09
  • Nombre de nuitĂ©es dans le dĂ©partement 11
  • Nombre de nuitĂ©es dans le dĂ©partement 12
  • Nombre de nuitĂ©es dans le dĂ©partement 30
  • Nombre de nuitĂ©es dans le dĂ©partement 31
  • Nombre de nuitĂ©es dans le dĂ©partement 32
  • Nombre de nuitĂ©es dans le dĂ©partement 34
  • Nombre de nuitĂ©es dans le dĂ©partement 46
  • Nombre de nuitĂ©es dans le dĂ©partement 48
  • Nombre de nuitĂ©es dans le dĂ©partement 65
  • Nombre de nuitĂ©es dans le dĂ©partement 66
  • Nombre de nuitĂ©es dans le dĂ©partement 81
  • Nombre de nuitĂ©es dans le dĂ©partement 82
  • Nombre de nuitĂ©es dans la rĂ©gion Occitanie

Attention : pour les 2018-12-03 et le 2018-08-29, le nombre de nuitĂ©es est Ă©gal Ă  zĂ©ro Ă  cause d’un problĂšme de rĂ©cupĂ©ration de donnĂ©es pour ces jours-lĂ .

par_origines

Pour chaque jour de l’annĂ©e 2018 (532 399 lignes / 8 colonnes) :

  • Date
  • DĂ©partement ou pays d’origine des touristes
  • DĂ©partement de destination en Occitanie
  • Volume de nuitĂ©es dans le dĂ©partement de destination
  • Statut des vacances du dĂ©partement d’origine
  • TempĂ©rature Ă  midi (solaire) du dĂ©partement de destination :
    • 0 : pas en vacances,
    • 1 : en vacances,
    • 2 : non renseignĂ©
  • Statut qualificatif de la mĂ©tĂ©o du dĂ©partement de destination :
    • 0 : mĂ©tĂ©o trĂšs dĂ©favorable,
    • 1 : mĂ©tĂ©o dĂ©favorable,
    • 2 : mĂ©tĂ©o correcte,
    • 3 : mĂ©tĂ©o favorable,
    • 4 : mĂ©tĂ©o idĂ©ale
  • Nombre d’évĂ©nements majeurs dans le dĂ©partement de destination

capacités

Pour chaque département (13 lignes / 61 colonnes)

  • DĂ©partement
  • Nom du dĂ©partement
  • Population du dĂ©partement
  • Nombre de places (personnes) en hĂ©bergement collectif
  • Nombre de places (personnes) en hĂ©bergement locatif
  • Nombre de places (personnes) en hĂ©bergement de plein air
  • Nombre de places (personnes) en hĂ©bergement hĂŽtellier
  • Nombre de places (personnes) total
  • Nombre de nuitĂ©es pour la semaine 1
  • Nombre de nuitĂ©es pour la semaine 53

Donnés complémentaires :

  • codage des dĂ©partements, codage des pays et liste des Ă©vĂ©nements.

ModalitĂ©s d’examen :

Ce challenge ne consiste pas seulement Ă  produire un graphique : il s’agit de raconter une histoire visuelle complĂšte et de la prĂ©senter comme un vĂ©ritable projet professionnel. Vous devrez montrer que vous savez sĂ©lectionner des donnĂ©es pertinentes, les transformer en une reprĂ©sentation claire et esthĂ©tique, et surtout, expliquer ce que cela signifie pour le tourisme en Occitanie.

Votre travail devra prendre la forme d’une dataviz commentĂ©e accompagnĂ©e d’une prĂ©sentation orale ou d’une vidĂ©o explicative. L’objectif est de convaincre votre public que votre analyse Ă©claire un phĂ©nomĂšne rĂ©el.

Le format exact est libre : vous pouvez prĂ©senter votre production sous la forme d’un document PDF, d’un diaporama, d’un mini-site web ou d’une courte capsule vidĂ©o. Ce qui importe n’est pas la technologie utilisĂ©e, mais la cohĂ©rence et la force du message.

Chaque projet doit comporter quatre éléments essentiels.
D’abord, une courte introduction prĂ©sentant la question de dĂ©part : qu’avez-vous voulu comprendre ou montrer ? Cette question guidera tout votre travail. Ensuite, une ou plusieurs visualisations (carte, graphique, diagramme
) créées Ă  partir de vos donnĂ©es et accompagnĂ©es d’un texte d’analyse clair. Ce texte doit indiquer ce que montre le graphique, pourquoi c’est intĂ©ressant, et quelles hypothĂšses ou explications vous en tirez. TroisiĂšme Ă©lĂ©ment : la mention des outils utilisĂ©s (Excel, Power BI, Tableau, Python
). Enfin, une conclusion synthĂ©tique, qui rĂ©sume les principaux enseignements de votre dataviz et les Ă©ventuelles limites de votre travail.

Le ton attendu est professionnel mais accessible. Vous n’écrivez pas pour un statisticien, mais pour un lecteur curieux, un dĂ©cideur ou un acteur du tourisme. Cherchez Ă  rendre visible l’invisible : une tendance qui passe inaperçue, un Ă©cart entre deux territoires, une relation inattendue entre mĂ©tĂ©o et frĂ©quentation. La valeur ajoutĂ©e de votre travail rĂ©side dans votre capacitĂ© Ă  donner du sens aux chiffres et Ă  proposer une lecture nouvelle des dynamiques touristiques.

La crĂ©ativitĂ© est encouragĂ©e, Ă  condition qu’elle serve la clartĂ©. Vous pouvez insĂ©rer des cartes interactives, des tableaux de bord dynamiques, ou simplement des visuels fixes bien construits. Ce qui compte, c’est la justesse du regard et la cohĂ©rence du propos. Un projet simple mais bien pensĂ© vaut mieux qu’une dĂ©monstration technique confuse. La rigueur scientifique – vĂ©rification des donnĂ©es, transparence des sources, neutralitĂ© du ton – reste indispensable.

La prĂ©sentation orale ou la vidĂ©o doit durer environ dix minutes. Elle vise Ă  valoriser votre dĂ©marche : expliquez vos choix, vos difficultĂ©s, vos dĂ©couvertes, et montrez comment vous avez donnĂ© vie Ă  vos donnĂ©es. L’objectif n’est pas d’impressionner, mais de faire comprendre.

Dans les deux cas, la présentation orale ou le visionnage de la vidéo, sera suivi(e) de questions pour une durée maximale de 5 minutes.

CritĂšres d’Ă©valuation :

Les travaux seront évaluées en fonction de différents critÚres dont les suivants :

Attention, il ne s’agit pas d’une “performance statistique” mais bien d’une Ă©preuve de crĂ©ativitĂ©, d’originalitĂ© et de recherche de la meilleure maniĂšre “d’Ă©clairer” les donnĂ©es.
Si vous avez tentĂ© une analyse complexe sans y aboutir, prĂ©sentez tout de mĂȘme Ă  la fin de votre prĂ©sentation ce que vous vouliez faire et comment vous avez essayĂ© de vous y prendre.

Horaires passage oral

Les passages Ă  l’oral seront dĂ©finis ultĂ©rieurement.

Sources d’inspiration

https://www.dataviz-inspiration.com/

https://www.data-to-viz.com/

https://datavizproject.com/

https://www.awwwards.com/websites/data-visualization/

https://viz.wtf/

Quelques outils

https://www.tableau.com/fr-fr/academic/teaching

https://observablehq.com/pricing

Python et quelques bibliothĂšques

https://www.python.org/

https://geopandas.org/en/stable/

https://python-visualization.github.io/folium/

https://pandas.pydata.org/

https://matplotlib.org/

https://seaborn.pydata.org/

📚 Cours gratuit – Tableau Public : Getting Started
https://public.tableau.com/app/learn
Découvrez comment créer facilement vos premiers graphiques interactifs.

🌐 Data to Viz : What chart to use when
https://www.data-to-viz.com/
Le guide visuel parfait pour choisir le bon type de graphique.

🐍 Tutoriel Python dĂ©butant – Visualiser des donnĂ©es avec Matplotlib
https://www.w3schools.com/python/matplotlib_intro.asp
Pour ceux qui veulent dĂ©couvrir Python sans prise de tĂȘte.

đŸ’» Tutoriel Power BI – Premiers pas
https://learn.microsoft.com/fr-fr/power-bi/fundamentals/power-bi-overview
Le guide officiel de Microsoft, clair et progressif.

Quelques tutos 😉

Dessiner une carte en Python

Dessiner un Sankey en Python

Amusez-vous !

Ce challenge est publiĂ© avec l’autorisation de l’association Toulouse Dataviz (https://toulouse-dataviz.fr/)