Explorer des données ouvertes
Cette semaine sur le MOOC EFAN FA, on ne rigole pas : nous travaillons sur deux nouvelles disciplines : l’Exploration de Données Educatives et l’Analytique de l’Apprentissage, on s’intéresse donc aux traces numériques et à leur exploitation à des fins pédagogiques. L’idée, c’est d’exploiter des données ouvertes à des fins pédagogiques. Le souci, c’est le choix des données de base sur le MOOC : intéressantes mais un vrai casse-tête pour en tirer du pédagogique : Les 1000 titres les plus recherchés au catalogue des bibliothèques de prêt.
Et puis comment dire : je ne suis pas du tout (mais alors pas du tout de pas du tout) scientifique. En fait, tout ce qui est chiffre me donne des boutons mais pour pallier à ce genre de manque, comme tout bon formateur, il y a longtemps que j’ai mis au point des stratégies : pour ne pas me retrouver en difficulté face à des statistiques quelconques demandées par ma hiérarchie ( Y sont contents de vos cours les stagiaires ? et à combien de pour cent ? et plutôt content du contenu ou plutôt content du visuel ? …), je gère donc pas mal Excel, au point même d’être formateur sur tableur. Du coup, le travail paraît assez simple : récupérer ces données au format Excel (facile, c’est tout fait par la source), les ouvrir, faire un tri selon l’objet d’étude choisi en se concentrant sur un seul aspect des données, enregistrer en convertissant au format CSV puis utiliser DATAWRAPPER qui est, comme il le dit lui-même : “Un outil libre aidant n’importe qui à créer en quelques minutes des graphiques simples, élégants et facilement intégrables” pour faire un graphique.
Euh, bon, je le dis qu’Excel aurait aussi bien fait le tout ? Allez, malgré ça, on comprend le but de l’équipe pédagogique : nous habituer à découvrir, utiliser, manipuler des outils en ligne, de préférence Open Source, pour s’en resservir pendant nos formations. Donc je fais ça, d’autant que le choix de données m’amuse assez en tant qu’éditeur associatif de bandes dessinées. Le fichier reprenant les recherches de BD dans les bibliothèques de Paris, je vais donc explorer cet aspect des choses. Ce qui m’intéressera particulièrement, c’est la différence de recherches entre enfants et adultes. Peut-on justement mettre en lumière une différence ? La Bd est-elle un média enfant ? ou est-elle tout public comme je le pense ?
Pour cela, je vais avoir à reprendre le total des recherches (nous ne disposons que des recherches) BD de la base de données puis en extraire les données spécifiquement adultes (Bande dessinée pour adulte + Bd adulte non réservable) et celles spécifiquement enfants (bande dessinée jeunesse + bande dessinée jeunesse>12 ans) et faire un pourcentage sur le total. Je me retrouve donc avec ce genre de tableau à importer dans datawrapper. Je m’inscris (Bien ! on peut mettre le site en français), j’importe facilement mes données, complète avec du texte (titre…), c’est plutôt intuitif.
Bandes dessinées enfants | Bandes dessinées adultes | Total |
1798 | 1919 | 3717 |
48% | 52% | 100% |
Une fois le fichier un peu nettoyé directement sur le site (j’ai enlevé le total inutile et les chiffres pour ne garder que les pourcentages plus clairs), j’obtiens ça :
Sur 31254 recherches au total général, la bande dessinée représente 12% (3717). Ce qui est intéressant avec ce graphique, c’est de constater que la Bd n’est clairement pas (plus ?) un média enfant puisque 52% des recherches sont sur de la BD adultes. De plus, ces statistiques ne différencient pas le public demandeur puisqu’au vu des titres, on peut très bien imaginer que certains adultes demandent des titres enfants. Ce que ça change pour nous, formateur ? Pas grand chose, nous avons depuis longtemps intégré la BD à nos cours (Ah ? pas vous ?) mais cela confirme l’idée que les adultes aussi, voire surtout eux, s’intéressent à ce média visuel qui peut raconter une histoire, mettre en situation, plonger dans un univers ou parfois synthétiser une idée.
(PS : Au passage, je crois que demander une intégration d’un Datawrapper qui génère une iframe alors que pas mal d’apprenants ont fait leur EAP sous wordpress.com qui n’accepte pas les iframes, ça va être souci …)
L’Open Data, c’est une réappropriation par l’usager de toute la sphère publique. C’est un outil d’appropriation des territoires : par là, je CONNAIS mon territoire. C’est aussi un outil d’aide à la décision : si je connais, je peux AGIR. Enfin c’est un outil de débat public ouvert : si je connais, je peux discuter les choix.
Je ne discute pas l’intérêt global de l’Open Data, je suis acteur de territoire, président d’association, passionné et partageur d’histoire locale et donc gros consommateur de données. Là où je suis plus curieux d’usages, c’est dans le domaine de la formation. Je suis conscient des usages sur des études scientifiques ou humaines mais je ne crois pas que l’on soit impacté par cela dans le cadre de formation avec des apprenants adultes non qualifiés. A voir.