Dans le cadre de ce module d’analyse de donnĂ©es, vous allez vous intĂ©resser Ă une nouvelle approche du traitement des donnĂ©es, la “Data Visualisation”.
Câest quoi, une dataviz ?
Une dataviz, ou visualisation de donnĂ©es, consiste Ă transformer des donnĂ©es brutes en une reprĂ©sentation visuelle â carte, graphique, tableau de bord ou schĂ©ma â pour rendre visible ce qui, autrement, resterait abstrait. Elle sert Ă faire parler les donnĂ©es, Ă dĂ©tecter des tendances ou des anomalies, et Ă comprendre en quelques secondes ce quâun tableau de chiffres mettrait des pages Ă exprimer.
Dans le domaine du tourisme, une dataviz permet par exemple de visualiser dâoĂč viennent les touristes, Ă quelles pĂ©riodes de lâannĂ©e ils voyagent, combien de nuitĂ©es ils effectuent ou encore dans quels dĂ©partements ils sĂ©journent le plus. En un coup dâĆil, elle offre une lecture immĂ©diate de phĂ©nomĂšnes complexes : la saisonnalitĂ©, les comportements de dĂ©placement, ou la rĂ©partition gĂ©ographique de la frĂ©quentation.


Mais la dataviz nâest pas quâun outil de synthĂšse : câest une vĂ©ritable forme de rĂ©cit visuel. Elle raconte une histoire Ă partir des donnĂ©es, comme un reportage chiffrĂ© oĂč chaque graphique illustre une idĂ©e. En cela, elle dĂ©passe la simple prĂ©sentation statistique pour devenir un outil de comprĂ©hension et de dĂ©cision. Les chiffres cessent dâĂȘtre des entitĂ©s froides pour devenir les acteurs dâune narration : celle du territoire, de ses visiteurs et de son Ă©volution.
La visualisation permet de dépasser les chiffres « nus » pour devenir un outil de décision, un « récit visuel ».
    Cette dataviz illustre comment un territoire peut ĂȘtre racontĂ© visuellement. Ă partir des donnĂ©es du programme CORINE Land Cover (1990â2018), elle montre lâĂ©volution de lâoccupation des sols Ă SĂłller, sur lâĂźle de Majorque. En un regard, on perçoit trois dynamiques : une urbanisation en forte hausse (+181 ha), un recul marquĂ© des terres agricoles (â802 ha) et une progression des zones forestiĂšres et naturelles (+618 ha). Les graphiques et la carte combinĂ©s permettent de comprendre que le paysage se transforme : lâespace urbain sâĂ©tend, lâagriculture rĂ©gresse et la forĂȘt regagne du terrain. Cette visualisation illustre la puissance de la dataviz : elle fait voir une tendance, une tension et une histoire territoriale, sans nĂ©cessiter de longues explications.
đŻ Pourquoi câest utile (et pourquoi pour vous)
Pour les Ă©tudiants en tourisme, la dataviz est avant tout un langage visuel qui permet de montrer plutĂŽt que de simplement dĂ©crire. Dire que la frĂ©quentation baisse en hiver est une affirmation ; le montrer avec une courbe saisonniĂšre rend cette rĂ©alitĂ© tangible. La dataviz vous apprend donc Ă communiquer efficacement une observation et Ă donner Ă vos interlocuteurs les moyens de la comprendre instantanĂ©ment. Câest un outil de diagnostic, mais aussi de persuasion.
Pour les Ă©tudiants en technologies de lâinformation et de la communication, la dataviz reprĂ©sente une application concrĂšte de vos compĂ©tences numĂ©riques. Elle permet de manipuler des jeux de donnĂ©es rĂ©elles, dâutiliser des outils de traitement et de visualisation comme Excel, Power BI ou Python, et dâen tirer un rĂ©sultat immĂ©diatement interprĂ©table. Contrairement Ă des exercices purement techniques, ici la donnĂ©e prend sens dans un contexte mĂ©tier rĂ©el : celui du tourisme rĂ©gional et de ses enjeux Ă©conomiques, sociaux et environnementaux.
Dans vos futurs mĂ©tiers, cette compĂ©tence fera la diffĂ©rence. Les acteurs du tourisme â offices, agences, collectivitĂ©s, chaĂźnes hĂŽteliĂšres, gestionnaires de destinations â utilisent de plus en plus la visualisation pour orienter leurs dĂ©cisions. Les donnĂ©es de frĂ©quentation, de satisfaction, de mobilitĂ© ou de durabilitĂ© sont dĂ©sormais au cĆur des stratĂ©gies. Une dataviz claire et pertinente peut influencer un choix dâinvestissement, guider une politique de communication, ou rĂ©vĂ©ler un potentiel inexploitĂ©.
Savoir concevoir une visualisation de donnĂ©es, mĂȘme simple, vous rendra donc plus autonomes dans lâanalyse, plus crĂ©dibles dans vos argumentations et plus attractifs sur le marchĂ© du travail. Vous serez capables non seulement de lire les chiffres, mais aussi de les interprĂ©ter, de les traduire et de les mettre en rĂ©cit. Câest exactement ce que les entreprises recherchent aujourdâhui : des professionnels capables de donner du sens Ă lâinformation.
Objectif du challenge
Votre objectif consistera Ă analyser, en Ă©quipe, un jeu de donnĂ©es et Ă raconter une histoire avec des graphiques Ă partir dâun jeu de donnĂ©es original comme vous le feriez pour un concours de “Data Visualisation” (ou “DataViz”).
Cette activitĂ© va vous amener Ă comprendre comment les donnĂ©es façonnent les reprĂ©sentations du tourisme et comment leur visualisation peut devenir un levier stratĂ©gique. Ă travers ce challenge, vous allez dĂ©velopper une compĂ©tence recherchĂ©e : la capacitĂ© Ă traduire des donnĂ©es en dĂ©cisions, Ă relier des faits Ă des enjeux concrets, et Ă construire une narration qui donne envie dâagir.
Ne cherchez pas Ă faire de grandes dĂ©monstrations “mathĂ©matiques” mais plutĂŽt Ă raconter une histoire comprĂ©hensible et intĂ©ressante pour tou(te)s. Accordez donc une importance particuliĂšre Ă cette “histoire”, que vous allez raconter, et au design de vos graphiques et supports.
Vous ne produirez pas seulement des graphiques : vous Ă©crirez, avec des chiffres et des couleurs, une histoire du tourisme en Occitanie. Une histoire rigoureuse, mais vivante. Une histoire qui, comme le territoire quâelle raconte, invite Ă la dĂ©couverte.
Descriptif du challenge
đ Raconter le tourisme en Occitanie Ă travers les donnĂ©es
Chaque chiffre raconte une histoire. DerriĂšre les millions de nuitĂ©es, les flux de visiteurs, les pics de frĂ©quentation ou les variations saisonniĂšres, il y a des comportements, des choix, des envies humaines. Le tourisme nâest pas seulement une sĂ©rie de statistiques : câest un mouvement vivant, celui des personnes qui voyagent, dĂ©couvrent, reviennent, consomment, ou choisissent de rester. En donnant vie Ă ces chiffres, la dataviz permet de raconter le territoire autrement, dâen dĂ©voiler les rythmes et les contrastes.
LâOccitanie est une rĂ©gion dâune richesse exceptionnelle. Des plages de la MĂ©diterranĂ©e aux cimes des PyrĂ©nĂ©es, des villages du Gers aux mĂ©tropoles de Toulouse et Montpellier, elle offre une diversitĂ© rare. Pourtant, cette diversitĂ© ne se lit pas toujours dans les discours : elle se dĂ©couvre dans les donnĂ©es. En Ă©tudiant les flux touristiques, on comprend que le tourisme nâest pas uniforme. Certains dĂ©partements attirent une clientĂšle internationale, dâautres vivent du tourisme local ou saisonnier. Certains espaces sont saturĂ©s en Ă©tĂ©, dâautres conservent une frĂ©quentation stable toute lâannĂ©e. Les donnĂ©es permettent de visualiser ces dynamiques et dâen tirer des enseignements concrets.
Raconter le tourisme en Occitanie Ă travers les donnĂ©es, câest aussi mettre en lumiĂšre les tendances qui se cachent derriĂšre les moyennes. Par exemple, une hausse globale du nombre de visiteurs peut masquer des rĂ©alitĂ©s opposĂ©es : une forte croissance sur le littoral, mais un dĂ©clin dans lâarriĂšre-pays. GrĂące Ă la dataviz, ces nuances deviennent visibles. Vous pouvez montrer comment les Ă©vĂ©nements culturels, la mĂ©tĂ©o, ou les politiques locales influencent la frĂ©quentation. Vous pouvez aussi rĂ©vĂ©ler les Ă©volutions de long terme : la montĂ©e du tourisme durable, lâimpact du transport ferroviaire, ou la redĂ©couverte du tourisme de proximitĂ© depuis la crise sanitaire.
LâintĂ©rĂȘt de ce travail est double : il est analytique et crĂ©atif. Analytique, car vous allez apprendre Ă explorer des jeux de donnĂ©es rĂ©els sur le tourisme en Occitanie : frĂ©quentation hĂŽteliĂšre, hĂ©bergements, provenance des visiteurs, conditions mĂ©tĂ©orologiques, Ă©vĂ©nements, etc. CrĂ©atif, car vous devrez transformer ces chiffres en un rĂ©cit visuel que chacun peut comprendre, sans jargon statistique. Votre mission nâest pas de âfaire des calculsâ, mais de faire parler les chiffres pour quâils deviennent un outil de comprĂ©hension du territoire.
Raconter le tourisme par la donnĂ©e, câest enfin prendre position en tant quâobservateur et interprĂšte. Vous allez choisir un angle, poser des hypothĂšses, croiser des informations. Ce choix est essentiel : il montre que derriĂšre la visualisation, il y a une rĂ©flexion. Vous ne cherchez pas Ă prouver, mais Ă comprendre. Vous ne cherchez pas Ă convaincre, mais Ă faire voir autrement.
Le tourisme dans la région Occitanie en 2018
Tout au long de lâannĂ©e, des milliers de touristes dorment dans notre belle rĂ©gion.
Vous trouverez ici un jeu de données unique qui les localise et les compte par nuitée.
Vous connaissez :
- Les capacitĂ©s dâhĂ©bergement (hĂŽtel, camping,..) de chaque dĂ©partement
 - La provenance des touristes, que ce soit dâun dĂ©partement Français ou de lâĂ©tranger
 - Le temps quâil faisait et les principaux Ă©vĂ©nements culturels pour chaque journĂ©e
 
Quelques rĂšgles du jeu
- Vous pouvez utiliser tous les outils quâils souhaitent pour explorer ces donnĂ©es et en proposer une reprĂ©sentation visuelle Ă base de graphique tels que Excel, SPSS, PSPP, Tableau (https://www.tableau.com/), Observabke HQ (https://observablehq.com/) et toutes les bibliothĂšques Python ainsi que tout support de prĂ©sentation de vos rĂ©sultats tels que PowerPoint, Canva, Adobe PDF…
 - Vous devez fournir la liste des outils utilisés pour la réalisation des graphiques
 - Vous pouvez utiliser tout type d’outil d’analyse de donnĂ©es tels que
 - Vous pouvez effectuer tous types de calcul à partir de ce jeu de données
 - Le format de restitution de cette analyse visuelle est laissĂ© Ă votre libre choix. Vous pouvez utiliser un format pdf (Ă©quivalent de 2 pages A4) aussi bien qu’un site web (Ă©quivalent de 3 captures dâĂ©cran) ou des reprĂ©sentations avec PowerBI, Tableau ou d’autres logiciels d’analyse et de reprĂ©sentation.
 - Vous ajouterez tous les éléments contextuels nécessaires pour commenter le ou les graphiques.
 - Vous n’ĂȘtes pas dans lâobligation dâutiliser toutes les donnĂ©es.
 - Hormis des fonds de carte, vous n’ĂȘtes pas autorisĂ©(e)s Ă utiliser dâautres donnĂ©es que celles fournies.
 
Les données du challenge
Les sources des jeux de données
- Les volumes de nuitées ont été construites par un opérateur de téléphonie mobile à partir des bornages téléphoniques. Ces données ont été fournies par le Comité Régional du Tourisme (CRT)
 - Les donnĂ©es concernant les capacitĂ©s dâhĂ©bergement ont Ă©tĂ© construites par TDV Ă partir de donnĂ©es fournies par le ComitĂ© RĂ©gional du Tourisme (CRT).
 - Les données concernant les événements ont été construites par TDV à partir de données fournis par le Comité Régional du Tourisme (CRT)
 - Les donnĂ©es mĂ©tĂ©o proviennent dâun site internet fournissant lâhistorique des donnĂ©es mĂ©tĂ©o pour un grand nombre de villes en France et dans le monde
 - Les données de géométrie des départements sont incluses uniquement dans le fichier geojson. Ce format est adapté pour ceux qui souhaitent utiliser des outils de cartographie tels que le logiciel libre QGIS ou des librairies javascript telles que d3.js.
 - Les donnĂ©es de bornage tĂ©lĂ©phonique ne sont pas des donnĂ©es brutes mais le rĂ©sultat dâun travail de traitement innovant (redressement, segmentation, anonymisation ) rĂ©alisĂ© par lâopĂ©rateur de tĂ©lĂ©phonie avec la participation dâacteurs du tourisme. Les donnĂ©es âvolume de nuitĂ©esâ sont donc des estimations statistiques.
 - Les jeux de donnĂ©es sont utilisables dans ce cadre de ce module suite Ă l’obtention de l’accord de Monsieur Alain Otteinheimer, PrĂ©sident de l’association Toulouse Dataviz, dirigeant de DataSens.
 
Le descriptif exhaustif des donnĂ©es peut ĂȘtre trouvĂ© sur le dĂ©pĂŽt Github suivant : https://github.com/ToulouseDataViz/Hackaviz2020/blob/master/README.md
Les données comprennent plusieurs fichiers :
Des donnĂ©es synthĂ©tiques et facile dâaccĂšs : NuitĂ©es.xls et .CSV
- 365 lignes et 15 colonnes
 - Nuitées par jour en synthÚse par département
 
Le plus détaillé mais pas le plus simple à exploiter : par_origines.xlsx et .csv
- 493 235 lignes et 8 colonnes
 - par jour avec tous les détails
 
Croisement capacités x nuités : Sert de complément optionnel aux autres
- capacites.xlsx, .csv et .geojson
 - 13 lignes et 61 colonnes
 - par semaine en catégories de nuitées par département
 
Il est possible de faire de belles visualisations Ă partir dâun seul de ces trois fichiers de donnĂ©es, le plus simple Ă©tant nuitees qui est un aggrĂ©gat de par_origines.
Les plus experts arriveront Ă combiner les trois, mais il nâest pas certain que la plus belle histoire ait besoin de toutes ces donnĂ©es.
Lâimportant est de raconter une belle histoire avec des graphiques de qualitĂ©.
Détails des fichiers et téléchargement
Nuitées
Regroupement des donnĂ©es Ă partir du fichier par_origines. Pour chaque jour de lâannĂ©e (365 lignes / 15 colonnes)
- Date
 - Nombre de nuitées dans le département 09
 - Nombre de nuitées dans le département 11
 - Nombre de nuitées dans le département 12
 - Nombre de nuitées dans le département 30
 - Nombre de nuitées dans le département 31
 - Nombre de nuitées dans le département 32
 - Nombre de nuitées dans le département 34
 - Nombre de nuitées dans le département 46
 - Nombre de nuitées dans le département 48
 - Nombre de nuitées dans le département 65
 - Nombre de nuitées dans le département 66
 - Nombre de nuitées dans le département 81
 - Nombre de nuitées dans le département 82
 - Nombre de nuitées dans la région Occitanie
 
Attention : pour les 2018-12-03 et le 2018-08-29, le nombre de nuitĂ©es est Ă©gal Ă zĂ©ro Ă cause dâun problĂšme de rĂ©cupĂ©ration de donnĂ©es pour ces jours-lĂ .
par_origines
Pour chaque jour de lâannĂ©e 2018 (532 399 lignes / 8 colonnes) :
- Date
 - DĂ©partement ou pays dâorigine des touristes
 - Département de destination en Occitanie
 - Volume de nuitées dans le département de destination
 - Statut des vacances du dĂ©partement dâorigine
 - Température à midi (solaire) du département de destination :
- 0 : pas en vacances,
 - 1 : en vacances,
 - 2 : non renseigné
 
 - Statut qualificatif de la météo du département de destination :
- 0 : météo trÚs défavorable,
 - 1 : météo défavorable,
 - 2 : météo correcte,
 - 3 : météo favorable,
 - 4 : météo idéale
 
 - Nombre dâĂ©vĂ©nements majeurs dans le dĂ©partement de destination
 
capacités
Pour chaque département (13 lignes / 61 colonnes)
- Département
 - Nom du département
 - Population du département
 - Nombre de places (personnes) en hébergement collectif
 - Nombre de places (personnes) en hébergement locatif
 - Nombre de places (personnes) en hébergement de plein air
 - Nombre de places (personnes) en hébergement hÎtellier
 - Nombre de places (personnes) total
 - Nombre de nuitées pour la semaine 1
 - Nombre de nuitées pour la semaine 53
 
Donnés complémentaires :
- codage des départements, codage des pays et liste des événements.
 
ModalitĂ©s d’examen :
Ce challenge ne consiste pas seulement Ă produire un graphique : il sâagit de raconter une histoire visuelle complĂšte et de la prĂ©senter comme un vĂ©ritable projet professionnel. Vous devrez montrer que vous savez sĂ©lectionner des donnĂ©es pertinentes, les transformer en une reprĂ©sentation claire et esthĂ©tique, et surtout, expliquer ce que cela signifie pour le tourisme en Occitanie.
Votre travail devra prendre la forme dâune dataviz commentĂ©e accompagnĂ©e dâune prĂ©sentation orale ou dâune vidĂ©o explicative. Lâobjectif est de convaincre votre public que votre analyse Ă©claire un phĂ©nomĂšne rĂ©el.
Le format exact est libre : vous pouvez prĂ©senter votre production sous la forme dâun document PDF, dâun diaporama, dâun mini-site web ou dâune courte capsule vidĂ©o. Ce qui importe nâest pas la technologie utilisĂ©e, mais la cohĂ©rence et la force du message.
Chaque projet doit comporter quatre éléments essentiels.
Dâabord, une courte introduction prĂ©sentant la question de dĂ©part : quâavez-vous voulu comprendre ou montrer ? Cette question guidera tout votre travail. Ensuite, une ou plusieurs visualisations (carte, graphique, diagrammeâŠ) créées Ă  partir de vos donnĂ©es et accompagnĂ©es dâun texte dâanalyse clair. Ce texte doit indiquer ce que montre le graphique, pourquoi câest intĂ©ressant, et quelles hypothĂšses ou explications vous en tirez. TroisiĂšme Ă©lĂ©ment : la mention des outils utilisĂ©s (Excel, Power BI, Tableau, PythonâŠ). Enfin, une conclusion synthĂ©tique, qui rĂ©sume les principaux enseignements de votre dataviz et les Ă©ventuelles limites de votre travail.
Le ton attendu est professionnel mais accessible. Vous nâĂ©crivez pas pour un statisticien, mais pour un lecteur curieux, un dĂ©cideur ou un acteur du tourisme. Cherchez Ă rendre visible lâinvisible : une tendance qui passe inaperçue, un Ă©cart entre deux territoires, une relation inattendue entre mĂ©tĂ©o et frĂ©quentation. La valeur ajoutĂ©e de votre travail rĂ©side dans votre capacitĂ© Ă donner du sens aux chiffres et Ă proposer une lecture nouvelle des dynamiques touristiques.
La crĂ©ativitĂ© est encouragĂ©e, Ă condition quâelle serve la clartĂ©. Vous pouvez insĂ©rer des cartes interactives, des tableaux de bord dynamiques, ou simplement des visuels fixes bien construits. Ce qui compte, câest la justesse du regard et la cohĂ©rence du propos. Un projet simple mais bien pensĂ© vaut mieux quâune dĂ©monstration technique confuse. La rigueur scientifique â vĂ©rification des donnĂ©es, transparence des sources, neutralitĂ© du ton â reste indispensable.
La prĂ©sentation orale ou la vidĂ©o doit durer environ dix minutes. Elle vise Ă valoriser votre dĂ©marche : expliquez vos choix, vos difficultĂ©s, vos dĂ©couvertes, et montrez comment vous avez donnĂ© vie Ă vos donnĂ©es. Lâobjectif nâest pas dâimpressionner, mais de faire comprendre.
Dans les deux cas, la présentation orale ou le visionnage de la vidéo, sera suivi(e) de questions pour une durée maximale de 5 minutes.
CritĂšres d’Ă©valuation :
Les travaux seront évaluées en fonction de différents critÚres dont les suivants :

Attention, il ne s’agit pas d’une “performance statistique” mais bien d’une Ă©preuve de crĂ©ativitĂ©, d’originalitĂ© et de recherche de la meilleure maniĂšre “d’Ă©clairer” les donnĂ©es.
Si vous avez tentĂ© une analyse complexe sans y aboutir, prĂ©sentez tout de mĂȘme Ă  la fin de votre prĂ©sentation ce que vous vouliez faire et comment vous avez essayĂ© de vous y prendre.
Horaires passage oral
Les passages Ă l’oral seront dĂ©finis ultĂ©rieurement.

Sources d’inspiration
https://www.dataviz-inspiration.com/
https://www.awwwards.com/websites/data-visualization/
Quelques outils
https://www.tableau.com/fr-fr/academic/teaching
https://observablehq.com/pricing
Python et quelques bibliothĂšques
https://geopandas.org/en/stable/
https://python-visualization.github.io/folium/
đ Cours gratuit â Tableau Public : Getting Started
https://public.tableau.com/app/learn
Découvrez comment créer facilement vos premiers graphiques interactifs.
đ Data to Viz : What chart to use when
https://www.data-to-viz.com/
Le guide visuel parfait pour choisir le bon type de graphique.
đ Tutoriel Python dĂ©butant â Visualiser des donnĂ©es avec Matplotlib
https://www.w3schools.com/python/matplotlib_intro.asp
Pour ceux qui veulent dĂ©couvrir Python sans prise de tĂȘte.
đ» Tutoriel Power BI â Premiers pas
https://learn.microsoft.com/fr-fr/power-bi/fundamentals/power-bi-overview
Le guide officiel de Microsoft, clair et progressif.
Quelques tutos đ
Amusez-vous !
Ce challenge est publiĂ© avec l’autorisation de l’association Toulouse Dataviz (https://toulouse-dataviz.fr/)