Paris passé au crible des sentiments numériques de ses visiteurs

Quelle est l’image numérique de la ville de Paris ? On en donne une idée ci-après, à partir de contenus générés par les utilisateurs (forums et sites), en contexte multilingue (anglais, japonais et allemand). Nos méthodes d’investigation sont celles de la fouille de données (sélection de sites/forums, aspiration des verbatim, analyse avec des outils statistiques et linguistiques), qui permettent d’évaluer, dans leur langue respective, les messages d’internautes venus à Paris : sont-ils conformes aux stéréotypes acceptés sur la capitale quant au service, à l’amabilité, aux prix ? Varient-ils en fonction de la nationalité ? Laissent-ils eux-mêmes transparaître les stéréotypes attribués à telle ou telle nationalité ?

Les verbatim des internautes ont été sélectionnés sur différents sites. L’étalon de mesure de la taille est le mot. Nous avons donc dû segmenter le corpus japonais à l’aide d’un outil linguistique : ChaSen.

L’analyse des corpus

Tonalité :

Pour les locuteurs anglais, nos ana­lyses témoignent d’une bonne opi­nion de Paris. Les adjectifs les plus présents sont “good”, “great”, “won­derful” ou encore “amazing” et “lo­vely”, mais également quelques ad­jectifs péjoratifs tel que “rude” ou “bad” - bien moins fréquents que les précédents. Le verbe “enjoy” est éga­lement l’un des plus fréquents dans le corpus Tripadvisor.

Pour le japonais, on constate que les adjectifs 素晴らしい (merveilleux) et 素敵 (joli) sont fréquents. Les Japo­nais, en effet, trouvent globalement Paris magnifique. On remarque aussi le nombre important d’occurrences de ミュージ アムパッス (Pass Musées). D’après le nombre important d’oc­currences de 今回 (cette fois) on serait tenté d’en déduire un attache­ment à Paris et une appréciation de leur séjour qui les amène à vouloir re­venir. Enfin les co-occurrents directs de Paris dans le corpus sont d’abord : 滞在 qui signifie “séjour”, et le troi­sième co-occurent le plus fréquent est 素敵 qui signifie “joli”.

Sur les forums allemands aussi, la tendance est positive. Les adjec­tifs le plus souvent associés à Paris étant “gut”, “schöne” et “erstaunlich” (respectivement “bien”, “jolie” et “incroyable”). Mais ces qualificatifs restent peu nombreux ; on en trouve seulement une vingtaine pour plus de 2300 occurrences de Paris.

Analyse de 4 champs sémantiques :

De ce qui ressort de l’analyse des corpus anglophones concernant les quatre champs sémantiques étudiés - le prix, la propreté, la sécurité et la comparaison avec d’autre villes ou pays - Paris est une ville plutôt “expensive” (359 occurrences sur les trois forums), moins cependant que certaines autres capitales (Londres notamment). De nombreux conseils sont donnés afin de faire des éco­nomies. Cela se remarque égale­ment sur le corpus tiré de Reddit : sur 46 phrases parlant du prix de la vie, 14 affirment qu’elle est chère, 7 avancent le contraire, et 25 sont en fait des demandes ou des proposi­tions de bons plans pour adoucir les prix (date de réservation).

Certains font état d’arnaques (“scam”) ou de vols par des “pick­pockets”, mais considèrent en grande majorité que Paris est une ville “safe” (409 occurrences) si l’on a du bon sens et qu’on prête attention à ses effets personnels à tout moment.

Autrement, plusieurs touristes ou futurs immigrés s’inquiètent de la sécurité de la ville après les attentats du 13 novembre, mais ont été immé­diatement rassurés par les parisiens.

Par ailleurs, la ville de Paris est consi­dérée comme “clean”.

Enfin, Paris est le plus souvent com­parée à Londres et Rome : ambiance différente, charme de la ville, diffé­rences entre les métros. Nous avons d’ailleurs pu observer que les trans­ports en communs sont des sujets récurrents dans le forum Tripadvisor : le mot “metro” est utilisé pas moins de 462 fois. D’après les internautes le métro est “easy to use” et “safe” mais trop souvent bondé. Quant à sa propreté, les avis divergent.

Dans les corpus japonais, il est fait assez souvent mention du pickpocket : Paris serait ainsi peu sûre, à l’aune des locuteurs japonais.

En ce qui concerne le prix, la réputa­tion de Paris comme ville chère n’est pas avérée. Les touristes japonais sont aussi surpris par les prix que nous par leur opinion : ils trouvent la ville plutôt bon marché !

La confrontation aux stéréotypes :

- Les Japonais et la réalité parisienne

En se concentrant sur les adjectifs, il est curieux de voir que ceux appa­raissant le plus souvent sont “magni­fique”, “merveilleux”, “beau” (qui peut signifier propre dans certains cas). Autrement dit, il n’est à aucun moment fait mention de la saleté des rues de Paris. L’absence de termes négatifs autour de Paris montre un véritable engouement pour la capi­tale.

-Le pragmatisme allemand

Pour les internautes allemands, Paris est chère (“teuer”). Et ils recherchent “güstiger Alternative” (des alterna­tives moins chères). On notera d’ail­leurs la popularité de la carte Paris Visite.

A l’exception des prix, ni la propreté, ni la saleté de la ville ne constituent des thèmes récurrents en allemand. La question de la sécurité revient souvent : pour beaucoup Paris est une ville sûre, y compris la nuit ; mais l’idée que Paris ait un “Sicherheits­problem” (problème de sécurité) est bien ancrée et on peut relever des conseils très hétérogènes (allant de ne pas juger les pickpockets à leur apparences à éviter le RER la nuit).

En conclusion

La fouille de textes multilingue est un outil de choix pour les acteurs du tourisme : elle révèle d’éventuelles critiques et donne aussi une carto­graphie précise des sentiments nu­mériques des visiteurs.