Un jeu : devinez ce que veut dire la carte ci-après ! Le gagnant remporte un vague commentaire de la carte en question (les perdants aussi, en fait).
Wikitrekk
On trouve de tout sur le million d'articles de la Wikipédia francophone. Ce blog est le récit d'une errance dans un monde encore sauvage…
mercredi 15 mai 2013
lundi 29 avril 2013
Loop…
La communauté wikipédienne s'était assez bien habituée à vivre à l'écart du monde. Entre deux engueulades sur la métaphysique des sources et de l'admissibilité, on discutait tranquillement de menhir du néolithique, d'impasses parisiennes et de philosophes mégariques loin du fracas et de la fureur de l'actualité. Cela va peut-être bientôt changer. La réputation croissante de Wikipédia a son revers : l'encyclopédie est désormais l'objet de quantité de regards et d'attentions.
Dans cette nouvelle configuration, le paradoxe de l'observateur s'en donne à cœur joie. Les débats interne à Wikipédia sur un objet réel tendent désormais à altérer cet objet. La procédure de page à supprimer de Nabilla constitue un cas d'école, déjà ébauché par celle de François Asselineau : l'initiative des contributeurs est médiatisée en tant que telle ; elle devient, bon an mal an, un élément sourçable d'une éventuelle biographie.
On assiste en somme à un effet de looping : Wikipédia ne fait que refléter les sources fiables existantes ; or les actions internes à Wikipédia modifient la teneur de ces sources et de la médiatisation préexistante ; ipse Wikipédia modifie Wikipédia. Comme le remarquait XKCD dans un petit strip bien troussé, il y a de quoi y perdre son latin :
Nous ne sommes sans doute qu'au début du phénomène. Des « loops » similaires peuvent très bien advenir dans le cas, pourtant moins suspect, des études académiques. Pour peu que Nabilla connaisse le même destin scientifique que Loana (aujourd'hui étudiée très sérieusement dans plusieurs thèses en sociologie), sa PàS risque de devenir à son tour une connaissance encyclopédique au plein sens du terme.
Sans compter que certains chercheurs, déçus de la non-admissibilité d'un sujet donné, peuvent très bien entreprendre d'écrire un article de recherche dessus, le rendant de facto admissibles… Nous ne sommes pas au bout de nos peines.
Dans cette nouvelle configuration, le paradoxe de l'observateur s'en donne à cœur joie. Les débats interne à Wikipédia sur un objet réel tendent désormais à altérer cet objet. La procédure de page à supprimer de Nabilla constitue un cas d'école, déjà ébauché par celle de François Asselineau : l'initiative des contributeurs est médiatisée en tant que telle ; elle devient, bon an mal an, un élément sourçable d'une éventuelle biographie.
On assiste en somme à un effet de looping : Wikipédia ne fait que refléter les sources fiables existantes ; or les actions internes à Wikipédia modifient la teneur de ces sources et de la médiatisation préexistante ; ipse Wikipédia modifie Wikipédia. Comme le remarquait XKCD dans un petit strip bien troussé, il y a de quoi y perdre son latin :
Nous ne sommes sans doute qu'au début du phénomène. Des « loops » similaires peuvent très bien advenir dans le cas, pourtant moins suspect, des études académiques. Pour peu que Nabilla connaisse le même destin scientifique que Loana (aujourd'hui étudiée très sérieusement dans plusieurs thèses en sociologie), sa PàS risque de devenir à son tour une connaissance encyclopédique au plein sens du terme.
Sans compter que certains chercheurs, déçus de la non-admissibilité d'un sujet donné, peuvent très bien entreprendre d'écrire un article de recherche dessus, le rendant de facto admissibles… Nous ne sommes pas au bout de nos peines.
mardi 23 avril 2013
Où s'arrêtera Wikipédia ? (suite et fin)
Avec beaucoup de retard, je viens satisfaire une promesse que j'avais complètement oubliée.
En conclusion de mon article de novembre dernier Où s'arrêtera Wikipédia ? j'annonçais la description prochaine d'une nouvelle évaluation du nombre d'article admissibles sur Wikipédia.
Il s'agirait de proposer une sorte de décompte alternatif à celui d'Emirjp, qui repose avant tout sur une appréciation fondamentale : tant de sujets existent dans l'absolu, tant d'articles doivent leur être consacré. Je m'inscris plus volontiers dans une approche constructiviste. C'est-à-dire que, de mon point-de-vue, est scientifique non pas ce qui existe, mais ce qui a été construit par un raisonnement scientifique et rationnel. Il existe des milliers d'espèces d'insectes non identifiées : même si elles existent dans l'absolu, on ne peut rien écrire sur elles.
Si l'on privilégie cette approche, il est nécessaire de déplacer la focale. Notre référent n'est plus les choses telles qu'elles sont, mais les analyses fiables de ces choses.
Selon une évaluation toute récente, les 7000 revues scientifiques de référence de par le monde publient un million d'articles académiques par an. Ce n'est là qu'une petite portion du savoir humain. Les chercheurs s'expriment aussi par de nombreux autres biais : revues informelles, conférences, thèses etc. Et quantité d'autres personnes sont associées au processus de production des connaissances : ingénieurs, journalistes, bloggers, et même monsieur tout-le-monde (si, si : ce sont des gens comme lui qui ont découvert plusieurs exoplanètes en triant les données du satellite Kepler). Si l'on ne s'en tient qu'à une fourchette basse, la totalité des textes à prétention scientifique véritablement intéressants (car ne nous leurrons pas : il y a du rebut dans le tas) doit représenter une vingtaine de millions par an.
Bien qu'imprécis, ce chiffre est tout de même tangible. Il est beaucoup plus difficile d'évaluer le nombre moyen d'objets inédits découverts ou scientificisés par un travail de recherche. Par exemple, une étude sur des fossiles du permien peut facilement mettre à jour une vingtaine de nouvelles espèces. Inversement, une démonstration mathématique de première ordre peut simplement améliorer un raisonnement déjà appréhendé de longue date.
Je ne pense pas être dans l'erreur complète en établissant que de nombreux travaux de recherche mettent à jour au moins un objet inédit ou ignoré. On aurait donc plusieurs millions d'articles potentiels chaque année. Et encore plus l'année suivante.
En effet, la science s'améliore à vitesse grand v. Chaque chercheur lit deux fois plus d'articles qu'en 1980. Les nouveaux outils de communication et de lecture permettent d'accélérer considérablement le travail de transmission de l'information au sein d'une communauté scientifique. L'automatisation de certaines techniques de recueil et de data mining fait également gagner du temps en évacuant des tâches rébarbatives.
Et il n'y a pas que le progrès technique. La sociologie des sciences évolue radicalement, avec l'arrivée probable de nombreux nouveaux entrants.
En établissant une multiplication par deux du nombre d'articles possibles d'ici la fin du siècle, j'étais certainement en-dessous de la vérité.
En conclusion de mon article de novembre dernier Où s'arrêtera Wikipédia ? j'annonçais la description prochaine d'une nouvelle évaluation du nombre d'article admissibles sur Wikipédia.
Il s'agirait de proposer une sorte de décompte alternatif à celui d'Emirjp, qui repose avant tout sur une appréciation fondamentale : tant de sujets existent dans l'absolu, tant d'articles doivent leur être consacré. Je m'inscris plus volontiers dans une approche constructiviste. C'est-à-dire que, de mon point-de-vue, est scientifique non pas ce qui existe, mais ce qui a été construit par un raisonnement scientifique et rationnel. Il existe des milliers d'espèces d'insectes non identifiées : même si elles existent dans l'absolu, on ne peut rien écrire sur elles.
Si l'on privilégie cette approche, il est nécessaire de déplacer la focale. Notre référent n'est plus les choses telles qu'elles sont, mais les analyses fiables de ces choses.
Selon une évaluation toute récente, les 7000 revues scientifiques de référence de par le monde publient un million d'articles académiques par an. Ce n'est là qu'une petite portion du savoir humain. Les chercheurs s'expriment aussi par de nombreux autres biais : revues informelles, conférences, thèses etc. Et quantité d'autres personnes sont associées au processus de production des connaissances : ingénieurs, journalistes, bloggers, et même monsieur tout-le-monde (si, si : ce sont des gens comme lui qui ont découvert plusieurs exoplanètes en triant les données du satellite Kepler). Si l'on ne s'en tient qu'à une fourchette basse, la totalité des textes à prétention scientifique véritablement intéressants (car ne nous leurrons pas : il y a du rebut dans le tas) doit représenter une vingtaine de millions par an.
Bien qu'imprécis, ce chiffre est tout de même tangible. Il est beaucoup plus difficile d'évaluer le nombre moyen d'objets inédits découverts ou scientificisés par un travail de recherche. Par exemple, une étude sur des fossiles du permien peut facilement mettre à jour une vingtaine de nouvelles espèces. Inversement, une démonstration mathématique de première ordre peut simplement améliorer un raisonnement déjà appréhendé de longue date.
Je ne pense pas être dans l'erreur complète en établissant que de nombreux travaux de recherche mettent à jour au moins un objet inédit ou ignoré. On aurait donc plusieurs millions d'articles potentiels chaque année. Et encore plus l'année suivante.
En effet, la science s'améliore à vitesse grand v. Chaque chercheur lit deux fois plus d'articles qu'en 1980. Les nouveaux outils de communication et de lecture permettent d'accélérer considérablement le travail de transmission de l'information au sein d'une communauté scientifique. L'automatisation de certaines techniques de recueil et de data mining fait également gagner du temps en évacuant des tâches rébarbatives.
Et il n'y a pas que le progrès technique. La sociologie des sciences évolue radicalement, avec l'arrivée probable de nombreux nouveaux entrants.
En établissant une multiplication par deux du nombre d'articles possibles d'ici la fin du siècle, j'étais certainement en-dessous de la vérité.
lundi 1 avril 2013
Motivations
On découvre parfois de drôles de choses. Tandis que je préparai — avec beaucoup de retard :-| — la prochaine livraison des Nouvelles du Wikilab, j'ai été contacté par un chercheur albanais. Depuis que le Signpost m'a fait un peu de pub, je reçois régulièrement ce genre de sollicitations internationales.
Il m'informait de l'existence d'une contribution décisive au débat sur les « motivations » des wikipédiens. Il s'agit en effet du pire serpent de mer de toute la brève histoire de la wikilogie. On ne sait toujours pas pourquoi Wikipédia fonctionne. Qu'est-ce qui pousse plusieurs dizaines de milliers de contributeurs à s'investir durablement dans une amène qui ne leur amène aucun bénéfice immédiat ?
De nombreuses pistes ont été envisagées. La plus fréquente est aussi la moins facile à identifier : la passion, le désir de connaître et de faire connaître. On trouve aussi pêle-mêle, l'illustration d'idéaux politiques (partage du savoir, open data…), la satisfaction d'écrire à des milliers de lecteurs, voire la volonté d'améliorer son réseau social…
Një kontribut vendimtar për studimin e motivimet e Wikipedia de Bermema et al. propose une hypothèse plus audacieuse. Il inclut dans le champ des motivations une explication jamais envisagée : l'excitation sexuelle.
Selon le résumé en anglais et le peu que j'ai pu comprendre du texte original en recourant au traducteur google, Skänker Bermema et son équipe s'appuient sur les récents développements de la sexologie. Les chercheurs de cette discipline mettent aujourd'hui l'accent sur les facteurs cognitifs. Il est ainsi tout-à-fait possible de connaître un état orgasmatique sans aucune stimulation physique (ce qui, selon toute vraisemblance, ne saurait advenir dans le cadre d'une contribution à Wikipédia).
Néanmoins, pour arriver à cette conclusion, les auteurs reconnaissent qu'il leur a fallu surmonter pas mal de préjugés. L'un d'entre eux, utilisateur actif sur la Wikipédia en albanais, les a mis sur la bonne voie. Il souligne dans une petite note de bas de page à caractère autobiographique l'étrangeté de son comportement :
Les chercheurs ont également développé une typologie intéressante. Les 24 sujets sensibles ne réagissent pas à des stimuli identiques. L'activité sexuelle n'est pas forcément solitaire : quelques contributeurs se sont lancés dans des guerres d'édition hautement érotiques. On a aussi observé quelques comportements sadiques et masochistes : des administrateurs prenaient plaisir à bloquer des utilisateurs qui, inversement, ne demandaient que cela.
En conclusion, les auteurs tentent d'analyser cet étrange phénomène. Ils relèvent une possible confusion des mécanismes cérébraux :
Il m'informait de l'existence d'une contribution décisive au débat sur les « motivations » des wikipédiens. Il s'agit en effet du pire serpent de mer de toute la brève histoire de la wikilogie. On ne sait toujours pas pourquoi Wikipédia fonctionne. Qu'est-ce qui pousse plusieurs dizaines de milliers de contributeurs à s'investir durablement dans une amène qui ne leur amène aucun bénéfice immédiat ?
De nombreuses pistes ont été envisagées. La plus fréquente est aussi la moins facile à identifier : la passion, le désir de connaître et de faire connaître. On trouve aussi pêle-mêle, l'illustration d'idéaux politiques (partage du savoir, open data…), la satisfaction d'écrire à des milliers de lecteurs, voire la volonté d'améliorer son réseau social…
Një kontribut vendimtar për studimin e motivimet e Wikipedia de Bermema et al. propose une hypothèse plus audacieuse. Il inclut dans le champ des motivations une explication jamais envisagée : l'excitation sexuelle.
Selon le résumé en anglais et le peu que j'ai pu comprendre du texte original en recourant au traducteur google, Skänker Bermema et son équipe s'appuient sur les récents développements de la sexologie. Les chercheurs de cette discipline mettent aujourd'hui l'accent sur les facteurs cognitifs. Il est ainsi tout-à-fait possible de connaître un état orgasmatique sans aucune stimulation physique (ce qui, selon toute vraisemblance, ne saurait advenir dans le cadre d'une contribution à Wikipédia).
Néanmoins, pour arriver à cette conclusion, les auteurs reconnaissent qu'il leur a fallu surmonter pas mal de préjugés. L'un d'entre eux, utilisateur actif sur la Wikipédia en albanais, les a mis sur la bonne voie. Il souligne dans une petite note de bas de page à caractère autobiographique l'étrangeté de son comportement :
Quand je me contentais de faire des modifications mineures, je ne remarquais rien d'anormal. Dès que je me lançais dans des entreprises plus ambitieuses, j'étais en proie à une certaine exaltation. Au cours d'une soirée, j'ai rédigé un article de qualité de A à Z : je me tordais littéralement de plaisir.L'étude a permis de confirmer le caractère assez ordinaire d'une telle rédaction. Elle portait sur la moitié de la communauté active albanaise, soit 50 personnes. Bermema et son équipe ont mesuré leur activité cognitive au cours de trois séances de deux heures. 24 sujets ont effectivement expérimenté des réactions à caractère sexuel et 6 d'entre eux ont été jusqu'à l'orgasme.
Les chercheurs ont également développé une typologie intéressante. Les 24 sujets sensibles ne réagissent pas à des stimuli identiques. L'activité sexuelle n'est pas forcément solitaire : quelques contributeurs se sont lancés dans des guerres d'édition hautement érotiques. On a aussi observé quelques comportements sadiques et masochistes : des administrateurs prenaient plaisir à bloquer des utilisateurs qui, inversement, ne demandaient que cela.
En conclusion, les auteurs tentent d'analyser cet étrange phénomène. Ils relèvent une possible confusion des mécanismes cérébraux :
De même que l'écriture active certaines aires du cerveau utilisées auparavant pour tout autre chose, il semblerait que la contribution sur Wikipédia actualise des comportements usuellement convoqués dans le cadre d'une activité sexuelle. La structure collaborative de l'encyclopédie explique peut-être ce mélange des genres.Ils s'inquiètent également du caractère potentiellement pathologique de ce type de réactions. Certains cas analysés nécessitent apparemment un traitement médical adapté. Le sujet n°42 a ainsi exprimé son désarroi :
Je ne pouvais plus m'en passer [de Wikipédia]. Un soir tandis que je proposais une prise de décision sur la translittération arabe de Tirana, j'ai poussé des hurlements pendant une demi-heure. Mon épouse et mes voisins ont fini par me couper l'accès à Internet.NB. Tout ce savant compte-rendu ne sert bien entendu qu'à illustrer une vielle tradition populaire…
mardi 5 février 2013
Trans
Alexander a retrouvé ses clefs d'ici et ça m'a rappelé que j'en avais un double dans mon trousseau. Pourquoi ne vous infligerais-je donc pas une diatribe désordonnée sur ma marotte du moment ? À savoir, la traduction sur Wikipédia. Ou, pour être exact, la mauvaise traduction sur Wikipédia.
| Jérôme de Stridon, saint patron des traducteurs et des étudiants – doublement cher à mon cœur, donc |
L'une des façons d'enrichir Wikipédia consiste effectivement à traduire des articles provenant d'autres éditions linguistiques de l'encyclopédie : la licence sous laquelle elle est distribuée autorise tout à fait ce genre de procédé, pour peu que l'on n'oublie pas de créditer les auteurs originaux à l'aide du modèle adéquat. Le plus souvent, ces traductions s'effectuent à partir de l'anglais, puisque c'est d'une part la langue étrangère la plus diffusée en francophonie (et dans le monde entier, au fond), et d'autre part (ce qui n'est pas sans lien avec ce premier point) la langue qui possède le plus grand nombre d'articles : plus de quatre millions à l'heure actuelle, soit trois millions de plus qu'en français, et ceux qui existent dans les deux langues sont souvent (mais pas toujours, loin de là) plus développés en anglais. Bref, il semble n'y avoir que des avantages à traduire : c'est un moyen simple et rapide (davantage que d'écrire un article ex nihilo, en tout cas) d'améliorer Wikipédia en français, à la fois quantitativement (en créant de nouveaux articles) et qualitativement (en améliorant les existants).
Là, vous attendez un « mais » et vous avez bien raison. Donc, mais :
Encore faut-il que ce soit bien fait, et avec intelligence. Quitte à énoncer des platitudes, j'ai envie de rappeler qu'on ne s'improvise pas traducteur, et qu'il ne suffit pas de comprendre l'anglais (ou toute autre langue étrangère) pour pouvoir en traduire. C'est un travail délicat et subtil, qui exige de s'adapter au texte d'origine, mais qui exige également une bonne connaissance de la langue d'arrivée, ainsi que de solides notions du sujet dont on traite, même si les articles de Wikipédia sont censés être accessibles en eux-mêmes (et qu'ils échappent en grande partie, du fait même de leur nature encyclopédique, à d'autres pièges classiques de traduction comme l'intertextualité, les jeux de mots ou autres références culturelles).
Que voit-on, donc, sur Wikipédia ? Des traductions automatiques, bien entendu : il serait étonnant d'échapper à la solution de facilité par excellence, en dépit de ses faiblesses inhérentes. Heureusement, il est désormais bien entré dans les mentalités que de tels salmigondis sont à incendier illico presto, et ils ne font guère de mal à l'encyclopédie. Plus inquiétant à mon sens sont les traductions réalisées par des contributeurs de bonne volonté, mais qui ne maîtrisent pas, au choix, le fond de ce qu'ils traduisent, ou la forme de ce qu'ils produisent. Au risque de se retrouver avec des articles au style défaillant (collocations foirées, registres de langue négligés, concordance des temps dans les choux, you name it – c'est généralement lié à un désir malavisé de coller autant que possible au texte d'origine), voire au contenu erroné, soit que l'erreur ait été présente dans le matériau de base, soit qu'elle ait été introduite pendant le processus (j'ai récemment croisé un article, bien parti pour recevoir le label « bon article », qui confondait ainsi empire mongol et empire moghol...).
![]() |
| La moustache, peut-être ? |
Certes ennuyeuses, les mauvaises traductions deviennent carrément gênantes quand on les voit justement recevoir les labels « article de qualité » ou « bon article » sans que grand-monde ne sourcille. Je me sens souvent seul à pointer les défaillances stylistiques ou de traduction de ces articles. Cela s'inscrit sans doute de façon plus générale dans la question de la fiabilité des labels, un marronnier dont on récolte toujours régulièrement les fruits, mais cela m'inquiète quand même un peu.
Partons néanmoins de l'hypothèse que je ne suis pas un frustré psychorigide et qu'il y a effectivement un problème. Que faire pour améliorer la situation ? L'Atelier de lecture souffre malheureusement d'un manque chronique de bras (et votre serviteur se flagelle de ne pas y être plus actif), et l'Atelier de relecture ne semble guère mieux loti. Peut-être faudrait-il se tourner vers le vénérable projet Traduction. Créé en 2005, c'est depuis plusieurs années une coquille vide, usine privée d'ouvriers qui continue pourtant à tourner grâce à ses innombrables modèles et procédures qui embarrassent plus d'un nouveau bien intentionné. Dégraisser le mammouth (ah non, le totem de 2005 c'est le rhinocéros laineux) serait une tâche difficile et lourde, mais probablement bienvenue et positive, à condition de rassembler une masse critique de contributeurs suffisante pour que l'effort ne s'interrompe pas au bout de quelques mois.
Partons néanmoins de l'hypothèse que je ne suis pas un frustré psychorigide et qu'il y a effectivement un problème. Que faire pour améliorer la situation ? L'Atelier de lecture souffre malheureusement d'un manque chronique de bras (et votre serviteur se flagelle de ne pas y être plus actif), et l'Atelier de relecture ne semble guère mieux loti. Peut-être faudrait-il se tourner vers le vénérable projet Traduction. Créé en 2005, c'est depuis plusieurs années une coquille vide, usine privée d'ouvriers qui continue pourtant à tourner grâce à ses innombrables modèles et procédures qui embarrassent plus d'un nouveau bien intentionné. Dégraisser le mammouth (ah non, le totem de 2005 c'est le rhinocéros laineux) serait une tâche difficile et lourde, mais probablement bienvenue et positive, à condition de rassembler une masse critique de contributeurs suffisante pour que l'effort ne s'interrompe pas au bout de quelques mois.
Inscription à :
Messages (Atom)


