
Blogs: Une fille dans le top 10 ?
Le prochain classement Wikio se prépare. Il n'y aura pas de changement dans l'algo : je crois que nous avons trouvé une version stable, qui permet un bon renouvellement en fonction des tendances et de l'actu. Et devinez quoi : une fille entrera probablement dans le top 10 ! Je suis sûr que ça va faire plaisir à Olympe et à quelques autres. Evidemment, c'est sous réserve : il peut encore se passer des choses en cinq jours, mais je suis absolument ravi de voir que la machosphère se dégonfle quelque peu.
A vous de deviner qui ça peut-être. Je ne dirai rien.

Un indice, quand même : ce n'est pas Julie. Je suis vraiment ému de voir la solidarité qui a entouré cette maman "travailleuse pauvre" et SDF avec deux enfants (voir article du Monde) : elle entre directement dans le top 50. C'est grâce à vous, grâce à vos liens.
Voilà qui illumine ma journée...
Vous avez été nombreux à le deviner: c'est la géniale Pénélope Jolicoeur que vous avez propulsée 3e au classement général. Elle le mérite amplement, à la fois pour ses dessins, et pour sa générosite (cf. opération Mon Beau Sapin)
A vous de deviner qui ça peut-être. Je ne dirai rien.

Un indice, quand même : ce n'est pas Julie. Je suis vraiment ému de voir la solidarité qui a entouré cette maman "travailleuse pauvre" et SDF avec deux enfants (voir article du Monde) : elle entre directement dans le top 50. C'est grâce à vous, grâce à vos liens.
Voilà qui illumine ma journée...
Mise à jour du 3/12
Vous avez été nombreux à le deviner: c'est la géniale Pénélope Jolicoeur que vous avez propulsée 3e au classement général. Elle le mérite amplement, à la fois pour ses dessins, et pour sa générosite (cf. opération Mon Beau Sapin)

Pub: Ecureuil malin

Société: Mère, SDF et blogueuse
J'ai été terriblement touché par cet article du Monde (pleine page dans l'édition week-end)... Que dire de plus ? Quand on songe aux petits (ou gros) problèmes d'ego de la blogosphère, aux chipotages sur les places aux classements, ou aux problèmes variés de monétisation et de revenus AdSense, on se demande parfois si on vit sur la même planète...
Soutenons Julie par nos liens vers son blog : http://untempsderetard.blogspot.com/

Soutenons Julie par nos liens vers son blog : http://untempsderetard.blogspot.com/


Blogs: Fuites et liens radioactifs
Voilà, le classement d'octobre est quasiment bouclé... J'ai continué à améliorer l'algo, de façon à prendre en compte vos remarques et commentaires. La modification principale concerne la prise en compte des liens vers la page d'accueil (la "home") des blogs, alors que Wikio prenait en compte jusqu'ici seulement les liens de billet à billet (je l'évoquais ici). Le résultat est vraiment intéressant. On voit sortir des profondeurs du classement tout un tas de blogs nouveaux qui valent la peine d'être découverts, et en particulier des "blogs de filles", qui entrent nombreuses dans le top 100 (je suis sûr qu'Olympe va être contente que le "plafond de verre" se craquelle et que la "machosphère" régresse un peu. Manifestement le nouvel algo fait émerger de nouvelles communautés qui ont tendance à lier les blogs (donc les personnes), plutà´t que les infos (comme ont tendance à faire les geeks). C’est un peu l’aspect “rà©seau socialâ€, je prà©sume. Du coup la part des blogs high tech dans le top 100 diminue, et c'est aussi bien ! J'ai produit quelques stats, mais j'en ai laissé l'exclu à Mr. Xhark, qui avait eu la gentillesse de reprendre celles du mois dernier. Je vous invite à lire le détail chez lui.

Je vais vous proposer encore un peu de maths et de technique, pour vous expliquer une autre modif, beaucoup plus mineure, celle-là, mais puisque j'ai promis de tout vous dire, vous allez devoir maintenant me supporter ! Vous vous souvenez peut-être que quand j'ai pris le dossier en main, les liens étaient comptés avec un poids de 1 pendant 4 mois et puis tout d'un coup au bout de cette période ils n'étaient plus comptés du tout, c'est-à-dire prenaient un poids de 0. Il en résultait des "Wikio Dances" pas très souhaitables. Car s'il faut du mouvement, comme cela a été dit maintes fois en commentaires, il ne faut pas non plus que ça ressemble à du mouvement brownien (surtout dans les profondeurs du classement). Pressé par le temps, j'avais fait implémenter une rustine, qui consistait à donner aux liens un poids décroissant de façon linéaire sur 9 mois. Pas génial.
Une approche plus propre consiste à utiliser, là aussi, une décroissance exponentielle, une fonction décidément bien utile, qui peut servir à modéliser toutes les situations où une quantité décroît d'un taux proportionnel à sa valeur. On peut imaginer bien des façons pour les liens de perdre de leur force dans le temps, mais la façon qui me séduit le plus est celle-là. C'est aussi celle des éléments radioactifs (à propos de fuites...) Vous avez sans doute entendu parler de période radioactive ou de demi-vie. C'est le temps qu'il faut pour pour que la moitié des atomes d'un isotope radioactif se désintègre naturellement. Et plus elle longue, plus c'est embêtant dans le cas des déchets... Pour le krypton (allô, Superman ?) c'est 11 ans, pour le thorium plusieurs milliards d'années (mieux vaut ne pas en avoir trop dans sa cave !).
Pour les liens j'ai choisi deux mois. On pourrait bien sûr discuter de ce choix, et on pourra l'ajuster. Le premier mois, un lien vaut 1, le mois suivant 0,707 (à peu près : c'est la racine carée de 1/2...), le troisième mois (qui correspond à la demi-vie) 0,5 et ainsi de suite. Attention, contrairement à ce qu'on croît souvent la radioactivité ne disparaît pas au bout de deux fois la demi-vie ! Au bout de 22 ans vous aurez toujours du krypton, mais la moitié de la moitié. Et ainsi de suite... La courbe est la suivante :

Au bout de quatre mois, il reste 0,25, et après c'est vrai qu'il ne reste plus grand chose, mais un petit peu tout de même et ça suffit pour faire la différence pour des blogs qui sont quasi orphelins dans les profondeurs du classement. N'oublions pas que ce sont les valeurs relatives qui comptent, et donc celui qui a un vieux lien qui vaut 0,04 passe devant celui qui a un lien encore plus vieux qui vaut 0,03. Mais en aucun cas ils ne sont en compétition avec des blogs qui ont des liens "frais". C'est voulu, comme ça tout le monde a sa chance et le classement nous permet de faire des découvertes. Sinon ce serait ennuyeux comme la pluie (radioactive ?).
Le classement sera publié lundi. Il y a plein de bonnes surprises... Évidemment ce blog monte comme une flèche (entrée dans le top 10). Ça ne me plaît qu'à moitié parce que les mauvaises langues vont sûrement dire que je règle les paramètres pour me faire monter, ce qui n'est pas le cas. Mais bon. La caravane passe. Vous n'aviez qu'à pas me lier comme des malades. Mon billet sur la naissance de Wikio Labs a été le plus lié de septembre, toutes catégories confondues, et j'ai l'impression que celui sur les "entrailles du classement Wikio" a atteint des sommets en octobre aussi... La preuve que ça vous intéresse, quand même, vous ne feriez pas ça juste pour me faire plaisir ?
Sur ce, mon cheval m'attend. Un peu de détente me fera du bien !

Je vais vous proposer encore un peu de maths et de technique, pour vous expliquer une autre modif, beaucoup plus mineure, celle-là, mais puisque j'ai promis de tout vous dire, vous allez devoir maintenant me supporter ! Vous vous souvenez peut-être que quand j'ai pris le dossier en main, les liens étaient comptés avec un poids de 1 pendant 4 mois et puis tout d'un coup au bout de cette période ils n'étaient plus comptés du tout, c'est-à-dire prenaient un poids de 0. Il en résultait des "Wikio Dances" pas très souhaitables. Car s'il faut du mouvement, comme cela a été dit maintes fois en commentaires, il ne faut pas non plus que ça ressemble à du mouvement brownien (surtout dans les profondeurs du classement). Pressé par le temps, j'avais fait implémenter une rustine, qui consistait à donner aux liens un poids décroissant de façon linéaire sur 9 mois. Pas génial.
Une approche plus propre consiste à utiliser, là aussi, une décroissance exponentielle, une fonction décidément bien utile, qui peut servir à modéliser toutes les situations où une quantité décroît d'un taux proportionnel à sa valeur. On peut imaginer bien des façons pour les liens de perdre de leur force dans le temps, mais la façon qui me séduit le plus est celle-là. C'est aussi celle des éléments radioactifs (à propos de fuites...) Vous avez sans doute entendu parler de période radioactive ou de demi-vie. C'est le temps qu'il faut pour pour que la moitié des atomes d'un isotope radioactif se désintègre naturellement. Et plus elle longue, plus c'est embêtant dans le cas des déchets... Pour le krypton (allô, Superman ?) c'est 11 ans, pour le thorium plusieurs milliards d'années (mieux vaut ne pas en avoir trop dans sa cave !).
Pour les liens j'ai choisi deux mois. On pourrait bien sûr discuter de ce choix, et on pourra l'ajuster. Le premier mois, un lien vaut 1, le mois suivant 0,707 (à peu près : c'est la racine carée de 1/2...), le troisième mois (qui correspond à la demi-vie) 0,5 et ainsi de suite. Attention, contrairement à ce qu'on croît souvent la radioactivité ne disparaît pas au bout de deux fois la demi-vie ! Au bout de 22 ans vous aurez toujours du krypton, mais la moitié de la moitié. Et ainsi de suite... La courbe est la suivante :

Au bout de quatre mois, il reste 0,25, et après c'est vrai qu'il ne reste plus grand chose, mais un petit peu tout de même et ça suffit pour faire la différence pour des blogs qui sont quasi orphelins dans les profondeurs du classement. N'oublions pas que ce sont les valeurs relatives qui comptent, et donc celui qui a un vieux lien qui vaut 0,04 passe devant celui qui a un lien encore plus vieux qui vaut 0,03. Mais en aucun cas ils ne sont en compétition avec des blogs qui ont des liens "frais". C'est voulu, comme ça tout le monde a sa chance et le classement nous permet de faire des découvertes. Sinon ce serait ennuyeux comme la pluie (radioactive ?).
Le classement sera publié lundi. Il y a plein de bonnes surprises... Évidemment ce blog monte comme une flèche (entrée dans le top 10). Ça ne me plaît qu'à moitié parce que les mauvaises langues vont sûrement dire que je règle les paramètres pour me faire monter, ce qui n'est pas le cas. Mais bon. La caravane passe. Vous n'aviez qu'à pas me lier comme des malades. Mon billet sur la naissance de Wikio Labs a été le plus lié de septembre, toutes catégories confondues, et j'ai l'impression que celui sur les "entrailles du classement Wikio" a atteint des sommets en octobre aussi... La preuve que ça vous intéresse, quand même, vous ne feriez pas ça juste pour me faire plaisir ?
Sur ce, mon cheval m'attend. Un peu de détente me fera du bien !

Moteurs: Y a-t-il un Web apres Google ?
Orange m'a demandé ce que m'inspirait la longévité de Google, qui vient de fêter son dixième anniversaire. Je sais que je vais choquer bien des admirateurs inconditionnels, mais ce qui me frappe surtout c'est la stabilité extraordinaire, je dirais presque l'immobilité, du produit-phare de la firme, son moteur de recherche. Car si celui-ci a su remarquablement s'adapter au fil des années à l'explosion de taille du Web et à son changement de nature, son design et ses fonctionnalités sont incroyablement proches, à des détails près, de ce qu'elles étaient en 1998. Pourtant, pendant ce temps, le Web a connu une véritable révolution... Le plus étrange est que la concurrence est quasi éteinte, comme hypnotisée par la firme de Mountain View. Tous les concurrents, Orange compris, se présentent comme de pâles clones du moteur de référence... Comment cela peut-il s'expliquer ?
Je vous laisse lire la suite sur DreamOrange :

PS: Je précise que je suis conseiller scientifique de France Télécom et d'Orange depuis de nombreuses années, mais que ceci n'est pas un "publi-rédactionnel". J'ai été libre d'écrire exactement ce que je voulais sans la moindre censure. Ce papier reflète donc exactement mon point de vue.
Merci de commenter plutôt là-bas : j'aurais du mal à suivre deux fils de discussion ! [màj : apparemment il faut s'inscrire pour commenter sur DreamOrange -- mauvaise idée : c'est dissuasif !]
Je vous laisse lire la suite sur DreamOrange :

PS: Je précise que je suis conseiller scientifique de France Télécom et d'Orange depuis de nombreuses années, mais que ceci n'est pas un "publi-rédactionnel". J'ai été libre d'écrire exactement ce que je voulais sans la moindre censure. Ce papier reflète donc exactement mon point de vue.

Blogs: French, less sociable than you might have thought (but Italians even less so!)
We have already discussed several times on this blog (most notably in the comments) the fact that French bloggers seem to link to one another with far less regularity than their American counterparts. I had wanted to avoid stereotypes - the disciplined Germans, complaining French and romantic Italians etc. - and approach this with an open mind. Still, the results are fairly clear cut: each country has a different approach to Web 2.0.
I worked out the proportion of links on the blogs of the various countries in the Wikio database for September 2008. The results are clear: The US is well out in front with 0.17 links per post, or one link for every 6 posts. Then comes Germany, followed by the UK and then France, which has half the proportion of links of the United States (0.08 per post or one link for every 12 posts published). Then finally comes Spain and Italy. Cliches aside, it's funny to see the the Anglosaxons and Germans on one side, and the Latin countries on the other, the two flanking the French who sit slap-bang in the middle.
| Coutry | Links/post |
| US | 0.17 |
| DE | 0.12 |
| UK | 0.09 |
| FR | 0.08 |
| ES | 0.06 |
| IT | 0.05 |
Even more interesting is to see the results separated by link type: to another post or to a blog's homepage.
| Country | to a post | to homepage |
| US | 0.14 | 0.03 |
| DE | 0.10 | 0.02 |
| UK | 0.07 | 0.02 |
| FR | 0.03 | 0.04 |
| ES | 0.03 | 0.02 |
| IT | 0.03 | 0.02 |
You will notice that the different rates are essentially those of links from post to post: links to homepages occur in pretty much the same proportions from country to country (with a slightly higher rate for France). French, Spanish and Italian bloggers link to other posts 4 times less than Americans do.
These results lead me to two remarks:
1. First off, they explain the difficulties one encounters in trying to make a memetracker work in several countries - one which tracks 'hot' discussions by following post-to-post links. The example of Techmeme seems a difficult one to recreate in other cultures: for example Wikio's memetracker works better in the US than in France, where the discussions are less easily aggregated. New ideas are needed!
2. Also, as I explained in my last post [Fr], the Wikio rankings do not currently take into account links to homepages. This was a way of combating "chains", but (having seen your reactions and comments) we will evidently have to rethink this one too!

Socio: Testez votre Web appeal
Comme Olivier, je me permets de relayer un jeu à la fois amusant et très sérieux, qui vous permettra de tester votre "Web appeal". C'est une enquête dirigée par menée par Dominique Cardon, sociologue au "Laboratoire des usages" d'Orange Labs, en collaboration avec faberNovel et le programme “Identità©s actives†de la FING, en partenariat avec Libà©ration. Elle a à©tà© imaginà©e dans le cadre du sà©minaire ouvert et public "Les sciences sociales et le web 2.0" qui se rà©unit tous les mercredis matins à La Cantine, et pour but d'à©tudier ’à©volution de nos comportements à l'heure du web 2.0. Le test (environ un quart d'heure) est trà¨s bien fait. Il vous permettra de rà©và©ler votre profil en choisissant des photos et des amis qui vous situeront dans l'univers des réseaux sociaux en ligne.
En ce qui me concerne, j'ai peu de Web appeal... 16% (Olivier fait un bon 67% !) (cliquez pour agrandir).


Et voici le profil de mes amis-types :



Assez bien vu je dois dire !
NB: Les résultats de l'enquête seront rendus publics.
En ce qui me concerne, j'ai peu de Web appeal... 16% (Olivier fait un bon 67% !) (cliquez pour agrandir).


Et voici le profil de mes amis-types :



Assez bien vu je dois dire !
NB: Les résultats de l'enquête seront rendus publics.
A lire
- Pourquoi sommes-nous si impudiques, par Dominique Cardon (auteur de l'enquête)
- Enquêtes précédentes du Laboratoire des usages :

Buzz: Les nuages s'améliorent
Vous vous souvenez sans doute de mes nuages de buzz, qui essaient de donner une image des personnes qui font l'actu en temps réel (billet d'avril). Vous aviez été nombreux à réagir à l'époque, et j'avais été d'ailleurs (agréablement) surpris, une fois de plus, par la qualité et la pertinence des commentaires. En gros, vous aviez détecté la plus grande partie des difficultés, car aussi simple que ce problème puisse paraître, il est rempli d'embûches et de chausses-trapes... Il y a les variantes (Hillary Clinton / Hillary Rodham Clinton), les patronymes seuls (ok, on peut rattacher sans grand risque la plupart du temps Sarkozy et Nicolas Sarkozy, mais que faire de Clinton ?), les fausses pistes (on voudrait Taj Jackson mais pas Taj Mahal...), les personnages de fiction (Harry Potter ou Mickey Mouse : faut-il les garder ?). Etc. etc. La liste est impressionnante.

Depuis avril, j'ai pas mal travaillé sur le sujet avec la complicité éclairée de Jérôme de Wikio, que je remercie au passage, c'était un vrai plaisir (tient au fait : Jérôme de Wikio, ce n'est pas comme Albert de Monaco, n'est-ce pas ?). Le résultat est passé en production sur la nouvelle page d'accueil de Wikio depuis quelques jours :

Ce n'est pas parfait, il y a encore par-ci par-là de petits soucis, mais je pense que vous pourrez constater que la situation s'est améliorée (vous pourrez aussi regarder le buzz des différents pays ici -- la qualité est hélas un peu moins bonne).
Et voici une nouvelle fonctionnalité, qui n'est pour l'instant que sur Wikio Labs : les personnages de l'actu pour quatre grandes catégories : culture, international, politique et sport (les autres catégories comme santé ou science se prêtent mal à l'exercice : elles ne font pas assez apparaître de personnalités pour que le nuage ait un intérêt). Jérôme y travaille d'arrache-pied, et je pense que ça va passer en production sur les pages de catégories correspondantes sur Wikio d'ici quelque temps, mais en attendant vous pouvez jouer avec sur Labs:

Vos remarques sont comme toujours les bienvenues ! Et votre indulgence aussi... Parole : c'est un problème difficile !

Depuis avril, j'ai pas mal travaillé sur le sujet avec la complicité éclairée de Jérôme de Wikio, que je remercie au passage, c'était un vrai plaisir (tient au fait : Jérôme de Wikio, ce n'est pas comme Albert de Monaco, n'est-ce pas ?). Le résultat est passé en production sur la nouvelle page d'accueil de Wikio depuis quelques jours :

Ce n'est pas parfait, il y a encore par-ci par-là de petits soucis, mais je pense que vous pourrez constater que la situation s'est améliorée (vous pourrez aussi regarder le buzz des différents pays ici -- la qualité est hélas un peu moins bonne).
Et voici une nouvelle fonctionnalité, qui n'est pour l'instant que sur Wikio Labs : les personnages de l'actu pour quatre grandes catégories : culture, international, politique et sport (les autres catégories comme santé ou science se prêtent mal à l'exercice : elles ne font pas assez apparaître de personnalités pour que le nuage ait un intérêt). Jérôme y travaille d'arrache-pied, et je pense que ça va passer en production sur les pages de catégories correspondantes sur Wikio d'ici quelque temps, mais en attendant vous pouvez jouer avec sur Labs:

Vos remarques sont comme toujours les bienvenues ! Et votre indulgence aussi... Parole : c'est un problème difficile !

Blogs: Le Français n'est pas liant (mais l'Italien encore moins !)
Nous avons discuté à plusieurs reprises sur ce blog (notamment dans les commentaires) du fait que les blogueurs français semblent insérer beaucoup moins de liens que leurs homologues américains. J'ai voulu en avoir le coeur net, pour ne pas tomber dans des stéréotypes ridicules du genre l'Allemand est discipliné, le Français râleur ou l'Italien romantique, et le résultat semble sans appel : les différents pays ont bien des approches différentes du Web 2.0...
J'ai calculé la proportion de liens présents en septembre 2008 sur les blogs des différents pays dans la base Wikio. Le résultat est clair : les Etats-Unis sont largement en tête, avec 0,17 lien par billet, soit un lien pour 6 billets. Viennent ensuite l'Allemagne, le Royaume Uni, puis la France avec deux fois moins de liens qu'aux Etats-Unis (0,08 lien par billet, soit un lien pour 12 billets). Viennent ensuite, bons derniers, l'Espagne et l'Italie... Amusant, tout de même : d'un côté les pays anglo-saxons et germaniques, de l'autre les pays latins, avec la France au milieu !
| Pays | Lien/billet |
| US | 0,17 |
| DE | 0,12 |
| UK | 0,09 |
| FR | 0,08 |
| ES | 0,06 |
| IT | 0,05 |
La situation devient encore plus intéressante si l'on sépare les résultats par type de lien : vers un billet ou vers la page d'accueil ("home") d'un blog :
| Pays | vers billet | vers home |
| US | 0,14 | 0,03 |
| DE | 0,10 | 0,02 |
| UK | 0,07 | 0,02 |
| FR | 0,03 | 0,04 |
| ES | 0,03 | 0,02 |
| IT | 0,03 | 0,02 |
On constate que la différence est due surtout aux liens de billet à billet : les liens vers les pages d'accueil sont à peu près stables d'un pays à l'autre (avec un petit plus pour la France). Les blogueurs français, espagnols et italiens lient 4 fois moins les autres billets que les américains.
Ces résultats m'inspirent deux remarques :
1. Tout d'abord ils expliquent la difficulté qu'il y a à faire fonctionner dans certains pays, dont la France, des systèmes de type "memetracker", qui repèrent les discussions "chaudes" par les liens de billet à billet. L'exemple de Techmeme paraît difficilement reproductible dans d'autres cultures : le memetracker de Wikio par exemple, fonctionne mieux aux Etats-Unis qu'en France, où les discussions ont bien du mal à s'aggréger. Il faudra trouver des idées !
2. D'autre part, comme je l'expliquais dans un précédent billet, le classement Wikio ne tient pas à l'heure actuelle compte des liens vers les pages d'accueil. C'était une façon de lutter contre les "chaînes", mais (cela va dans le sens de vos réactions et commentaires) il va falloir manifestement revoir la question !

Blogs: Page Rank et Wikio Rank
Après avoir lu ma description de l'algorithme du classement Wikio, certains d'entre vous m'ont demandé : "Mais puisque le classement Wikio se base sur le nombre de rétroliens, n'est-il pas finalement plus ou moins équivalent au Page Rank de Google" ?
Bonne question en effet. La réponse est non : les deux indices mesurent des choses très différentes. En voici la démonstration.
J'ai pris le top 1000 du classement français de Wikio, et j'ai calculé le PR de Google pour chacun de ces sites. Voici le résultat sous forme de graphique. En abscisse (c'est-à-dire horizontalement), le "Wikio Rank" ; en ordonnée (verticalement) le Page Rank. Chaque point représente un blog du top 1000.

Vous voyez que les points se répartissent sous forme de nuage assez informe. Les statisticiens parmi vous savent que ce type de graphique apparaît quand il n'y a pas de corrélation entre les deux variables, ou une corrélation très faible. Il existe même un indice qui permet de calculer très précisément la "force" du lien entre les deux variables, le "coefficient de détermination". Je ne veux pas décourager les lecteurs allergiques aux maths, mais ce coefficient indique quelle est la part de la variation ("variance") d'une variable qui est complètement expliquée par l'autre. Si ce coefficient est de 1 les deux variables sont strictement équivalentes ; s'il est de 0, elle n'ont strictement rien à voir. Plus les variables sont liées, plus le nuage ressemble à une ligne droite (je simplifie ;-).
Ici, le coefficient de détermination est de 0,09. Il est donc très faible : le PR de Google permet de prédire moins de 10% de la variation du Wikio Rank.
Observons par exemple le top 20 :
On voit que dans le top 20, seulement deux blogs ont un PR de 7 (ce qui est très élevé : seuls des sites comme Le Monde, Le Figaro ou l'ANPE ont un PR de 8 en France). Mais si l'on regarde la chose plus en détail, on s'aperçoit que ce sont Techcrunch et Gizmodo, qui récupèrent du PR de leur équivalent en .com (qui est, lui PR8). Donc, un peu artificiel... De même, sans doute, le blog Dotclear, PR 6 (son domaine dotclear.net est PR 7).
Les autres PR 7 du top 1000 sont les suivants :
On notera qu'à part le blog de Pierre Assouline, République des livres, les autres PR 7 sont aussi un peu artificiels, puisqu'ils héritent de leur "maison mère" (Netvibes, Typepad). Du point de vue Google, on peut donc dire que République des livres est le blog français qui se distingue de tout le reste.
A part ce cas exceptionnel, on peut donc dire qu'un blog très bien côté chez Google se voit attribuer un PR 6. Voici par exemple les dix premiers PR 6 du classement Wikio :
Ce sont des blogs établis depuis longtemps (je pense au mien ou à Zorgloob), ou bien qui ont fait l'objet d'un gros buzz (Presse-Citron avec l'affaire Martinez) ou encore qui viennent juste d'obtenir leur PR 6 après une montée très spectaculaire (Vincent Abry). Mais ce qui est frappant, c'est que dans le top 20, on trouve des blogs très connus qui ont un PR faible : le Blog du Geek (3e) n'a qu'un PR 3 (il vient juste de faire un bon spectaculaire chez Wikio), Pisani ou Mashable n'ont qu'un PR 4...
A part quelques biais (la distribution du PR sur des sous-sites comme pour Typepad etc.), on peut dire que le Page Rank et le Wikio Rank mesurent des choses différentes.
Le PR de Google a tendance à mesurer la "visibilité" (je n'ose plus dire "influence", c'est un trop mauvais terme) d'un blog à long terme. Il cumule tous les liens présents sur le Web, alors que le classement Wikio donne une préférence à la période très récente (voir explications ici). Cela explique par exemple que ce blog ait gardé son PR 6 au cours des derniers mois alors que, comme vous l'avez remarqué, j'ai beaucoup moins publié au printemps et cet été : j'avais, comme il se doit, dégringolé dans le classement Wikio. Je remonte maintenant fortement, puisque j'écris à nouveau et que vous avez la gentillesse de me "linker". L'indice Wikio est donc beaucoup plus réactif.
De plus, le PR prend tous les liens, y compris de sites Web classiques, alors que le classement Wikio ne prend que les liens venant de flux RSS. Le PR reflète donc plus la visibilité globale (si ce n'est dans le "monde réel", mais du moins sur le Web dans son ensemble), alors que le Wikio Rank mesure la visibilité au sein de la blogosphère. Cela explique sans doute en partie la très belle performance de Pierre Assouline, dont le blog est beaucoup cité en dehors de la blogosphère (c'est le cas d'Aixtal aussi).
Il semble donc que Page Rank et Wikio Rank donnent des images différentes mais très complémentaires. Cela me laisse aussi penser que dans l'évolution future sur laquelle nous avons commencé à réfléchir collectivement, il ne faut sans doute pas trop croiser le Wikio Rank avec des critères qui se rapprochent de ceux du Page Rank (visibilité à long terme, liens hors de la blogosphère), sinon la richesse que constitue cette double mesure viendrait à s'estomper. Mais je vous laisse la parole, comme toujours...
Bonne question en effet. La réponse est non : les deux indices mesurent des choses très différentes. En voici la démonstration.
J'ai pris le top 1000 du classement français de Wikio, et j'ai calculé le PR de Google pour chacun de ces sites. Voici le résultat sous forme de graphique. En abscisse (c'est-à-dire horizontalement), le "Wikio Rank" ; en ordonnée (verticalement) le Page Rank. Chaque point représente un blog du top 1000.

Vous voyez que les points se répartissent sous forme de nuage assez informe. Les statisticiens parmi vous savent que ce type de graphique apparaît quand il n'y a pas de corrélation entre les deux variables, ou une corrélation très faible. Il existe même un indice qui permet de calculer très précisément la "force" du lien entre les deux variables, le "coefficient de détermination". Je ne veux pas décourager les lecteurs allergiques aux maths, mais ce coefficient indique quelle est la part de la variation ("variance") d'une variable qui est complètement expliquée par l'autre. Si ce coefficient est de 1 les deux variables sont strictement équivalentes ; s'il est de 0, elle n'ont strictement rien à voir. Plus les variables sont liées, plus le nuage ressemble à une ligne droite (je simplifie ;-).
Ici, le coefficient de détermination est de 0,09. Il est donc très faible : le PR de Google permet de prédire moins de 10% de la variation du Wikio Rank.
Observons par exemple le top 20 :
On voit que dans le top 20, seulement deux blogs ont un PR de 7 (ce qui est très élevé : seuls des sites comme Le Monde, Le Figaro ou l'ANPE ont un PR de 8 en France). Mais si l'on regarde la chose plus en détail, on s'aperçoit que ce sont Techcrunch et Gizmodo, qui récupèrent du PR de leur équivalent en .com (qui est, lui PR8). Donc, un peu artificiel... De même, sans doute, le blog Dotclear, PR 6 (son domaine dotclear.net est PR 7).
Les autres PR 7 du top 1000 sont les suivants :
On notera qu'à part le blog de Pierre Assouline, République des livres, les autres PR 7 sont aussi un peu artificiels, puisqu'ils héritent de leur "maison mère" (Netvibes, Typepad). Du point de vue Google, on peut donc dire que République des livres est le blog français qui se distingue de tout le reste.
A part ce cas exceptionnel, on peut donc dire qu'un blog très bien côté chez Google se voit attribuer un PR 6. Voici par exemple les dix premiers PR 6 du classement Wikio :
Ce sont des blogs établis depuis longtemps (je pense au mien ou à Zorgloob), ou bien qui ont fait l'objet d'un gros buzz (Presse-Citron avec l'affaire Martinez) ou encore qui viennent juste d'obtenir leur PR 6 après une montée très spectaculaire (Vincent Abry). Mais ce qui est frappant, c'est que dans le top 20, on trouve des blogs très connus qui ont un PR faible : le Blog du Geek (3e) n'a qu'un PR 3 (il vient juste de faire un bon spectaculaire chez Wikio), Pisani ou Mashable n'ont qu'un PR 4...
A part quelques biais (la distribution du PR sur des sous-sites comme pour Typepad etc.), on peut dire que le Page Rank et le Wikio Rank mesurent des choses différentes.
Le PR de Google a tendance à mesurer la "visibilité" (je n'ose plus dire "influence", c'est un trop mauvais terme) d'un blog à long terme. Il cumule tous les liens présents sur le Web, alors que le classement Wikio donne une préférence à la période très récente (voir explications ici). Cela explique par exemple que ce blog ait gardé son PR 6 au cours des derniers mois alors que, comme vous l'avez remarqué, j'ai beaucoup moins publié au printemps et cet été : j'avais, comme il se doit, dégringolé dans le classement Wikio. Je remonte maintenant fortement, puisque j'écris à nouveau et que vous avez la gentillesse de me "linker". L'indice Wikio est donc beaucoup plus réactif.
De plus, le PR prend tous les liens, y compris de sites Web classiques, alors que le classement Wikio ne prend que les liens venant de flux RSS. Le PR reflète donc plus la visibilité globale (si ce n'est dans le "monde réel", mais du moins sur le Web dans son ensemble), alors que le Wikio Rank mesure la visibilité au sein de la blogosphère. Cela explique sans doute en partie la très belle performance de Pierre Assouline, dont le blog est beaucoup cité en dehors de la blogosphère (c'est le cas d'Aixtal aussi).
Il semble donc que Page Rank et Wikio Rank donnent des images différentes mais très complémentaires. Cela me laisse aussi penser que dans l'évolution future sur laquelle nous avons commencé à réfléchir collectivement, il ne faut sans doute pas trop croiser le Wikio Rank avec des critères qui se rapprochent de ceux du Page Rank (visibilité à long terme, liens hors de la blogosphère), sinon la richesse que constitue cette double mesure viendrait à s'estomper. Mais je vous laisse la parole, comme toujours...
Fin du flux RSS...
Flux RSS
Jean VÉRONIS - Professeur de Linguistique et Informatique (Aix-en-Provence)
Rubrique Flux RSS Referencement - Nb abonnés : 3
Rubrique Flux RSS Referencement - Nb abonnés : 3
| Adresse du flux RSS à copier/coller |






technologies du langage