Backlinker http://www.backlinker.fr Référencement & Black Hat Seo Mon, 23 Jan 2012 19:56:46 +0000 en hourly 1 http://wordpress.org/?v=3.0.4 SEO Camp Day Toulouse 2012 : compte-rendu http://www.backlinker.fr/seo-camp-day-toulouse-2012-compte-rendu/ http://www.backlinker.fr/seo-camp-day-toulouse-2012-compte-rendu/#comments Mon, 23 Jan 2012 12:27:20 +0000 Backlinker http://www.backlinker.fr/?p=548 Samedi 21 janvier 2011 a eu lieu le Seo Camp Day à Toulouse, organisé par l’association de référencement Seo Camp. Après le Barcamp Black Hat 2011 à Toulouse ayant eu lieu en mai 2011, organisé par Rudy et Tiger, qui m’avait laissé un excellent souvenir (malgré le fait d’avoir loupé une sortie en boite mémorable semblerait-il ;) ), j’ai donc décidé de m’y rendre, afin de bien me remettre dans l’actualité SEO après 3 mois de R&D intensifs, m’empêchant de participer comme il se doit l’actu Twitter, blogs, forums.

Je vous avouerai que je ne connaissais pas plus que cela l’association SEO Camp, mais voyant que de grands noms participaient à cette journée, j’ai tenté ma chance.

Après un accueil vraiment chaleureux de la part des organisateurs, six conférences se sont donc enchainées de 13h à 19h. Certaines étaient très intéressantes.

I. Référencement à la cour

Je commencerai par la conférence de Stanley Claisse, celle m’ayant le plus appris et surpris. Surpris… car il s’agissait d’une conférence sur le droit, que Stanley est un avocat, et qu’on aurait facilement pu tomber dans un discours rébarbatif et soporifique (hélas c’est l’image que j’ai du droit..). Mais que nenni, Stanley est un avocat qui a su nous faire un cours juridique très ciblé sur notre métier de référenceur, de manière passionnante, avec un charisme, il faut le dire, sans faille, et une connaissance du web et du référencement remarquables.

La discussion a beaucoup tourné autour de la création de « contenu » , de « sites web satellites » et de « splogs ». J’en profite pour rappeler une différence entre ces deux termes : un site web satellite est un site web « propre » qui se veut « légitime » aux yeux de l’utilisateur, alors qu’un splog (contraction de spam et de blog) est typiquement un « blog » rempli de tonnes d’articles composés de charabia de texte destinés à être avaler par les moteurs de recherche. Un splog n’est donc pas du tout légitime aux yeux d’un utilisateur (et donc à long terme aux yeux des moteurs de recherche).  Les deux ont bien entendu pour objectif de référencer un ou plusieurs sites cibles. Au final, un bon référenceur fera en sorte de créer des très bons sites web satellites, alors que la feignasse de base court terme qui se fout de la qualité de son référencement fera du splog. (allez hop, premier pavé dans la mare ;) )

Stanley nous a donc rappelé à travers de nombreux exemples, dont des procès récents, que TOUTE copie, même partielle, d’un contenu créer par autrui pouvait nous faire envoyer au tribunal, et nous rendre coupable, dès lors que le juge estimait que votre contenu avait trop de ressemblance avec le contenu source. Un rappel très intéressant, car au final, la démocratisation de la « réutilisation » du contenu sur le web nous fait parfois oublié que certaines frontières sont à ne pas dépasser afin d’éviter de devoir appeler Stanley pour nous défendre…  Au final, on pourra en retenir qu’il vaut mieux ne pas « voler » ou « remanier » mais bien « créer » ou « acheter » car le risque juridique est réel. L’exemple le plus concret de ce genre de risque étant l’utilisation d’un script bien connu des français permettant de créer automatiquement du contenu en scrapant les autres blogs… =)

S’en suivra une discussion sur le buzz référencement fin 2011 : la condamnation du webmaster de Saveur Bière à 10k d’amende pour concurrence déloyale envers la société Sélection Bière. Nous avons tous été outrés par la décision du juge, mais Stanley a donné son avis sur cette décision, nous permettant de mieux la comprendre. Autour de ce buzz, la communauté de référencement en a retenu au final « comdamnation pour avoir créé des sites web satellites » (qui au final est une pratique commune dans le référencement), alors que Stanley nous a démontré que la décision portait plus sur un acharnement réel de la part de l’inculpé de manière exclusive envers la dite victime. A travers plusieurs exemples, on en ressort en se disant « Ah oui en effet… », car au final, la création des sites web satellites n’était qu’un acte parmi tant d’autres. Rassurant.

II. Full Automatisation

La deuxième conférence la plus intéressante à mes yeux était celle de notre cher Rudy. A travers un discours pétillant et drôle (c’est le spirit Black Hat qui fait ça je pense ;) ), il a su nous présenter sa « Factory » de sites web, interface globale lui permettant de créer à la volée des « pools » de sites web, automatisant toutes les étapes : réservation NDD, update DNS, mise en ligne CMS, mise en ligne contenu propre, veille, etc. Je pense que ce genre de présentation fait sûrement « fureur » surtout face à un public « white hat », mais peu importe, pour ceux ne connaissant pas le concept de la full automatisation, il y avait beaucoup de choses à apprendre. Je ne m’étendrais pas sur le fonctionnement de sa « Factory », car c’est typiquement le genre de technologies dont je n’aime pas parler sur un blog. Par contre, il sera intéressant de réfléchir sur la manière de penser de Rudy, très (voire trop) proche de la mienne =). Rudy, au-delà d’être un mec qui aime les « thunes », c’est un loustique qui déteste faire les choses manuellement dès lors que répétition il y a. Bilan, il oriente tout son workflow vers l’automatisation et l’outsourcing. L’objectif est simple : pouvoir créer 1000 fois plus qu’une boite faisant les choses à la main, en 1000 fois moins de temps, c’est-à-dire, en appuyant sur un bouton après avoir rempli 3 champs de formulaires se battant en duel. Créer massivement à partir de peu. C’est avant tout une vision des choses et une industrialisation de ses process. Bien entendu, il faut à la fois la « vision » et la capacité de « réalisation » (ce qui est rarement possible quand on travaille seul d’ailleurs). Là où certains se contentent d’utiliser des outils ne répondant pas à 100% à leurs besoins, Rudy fait partie de ceux qui réaliseront leurs propres outils pour leurs propres besoins, de manière quotidienne.

III. Optimiser le secteur SEO

Pour terminer sur les conférences, je m’étendrai sur celle présentée par Sylvain et Guillaume Peyronnet, fondateurs de Manageref.com, dont le cœur de métier est la formation très ciblée de « Responsable SEO ».  En s’appuyant sur les résultats d’un premier sondage fait auprès des agences de référencement, et d’un deuxième fait auprès de clients ayant recourus à une prestation de référencement, les frères Peyronnet mettent en valeur un constat des plus importants : il existe un énorme fossé entre la vision d’une prestation réussie aux yeux des agences et du client. Très simplement, 50% des prestations sont considérées partiellement ou totalement un échec aux yeux des clients… alors que les agences sont beaucoup plus optimistes sur la qualité de leur prestation (étonnant heh).

Même  si cette énorme fissure sur la vision d’une « bonne prestation SEO » entre l’agence et le client, n’est pas forcément étonnante, les sondages ont le mérite de la chiffrer. Au-delà de mettre en avant cette problématique, les frères Peyronnet démontrent l’importance d’un poste de plus en plus sine qua none pour qu’une prestation de référencement se déroule bien, et que les résultats escomptés par le client concordent avec les résultats obtenus : le stratège SEO, qu’on pourrait définir comme le responsable SEO, au sein de l’entreprise si possible, sinon en consultant.

Personnellement, je vais me concentrer sur cette fameuse fissure. La problématique à l’heure actuelle est que le secteur du référencement est lui-même composé de plusieurs secteurs très spécifiques : recherche de KW, optimisation on-site, construction de liens, stratégie SEO, etc. Penser qu’une même agence de référencement est la meilleure dans chaque secteur relève de la folie (et j’insiste), et au final, quand un client passe par une agence, il ne saura en aucun cas la qualifier, si ce n’est vis-à-vis des résultats obtenus, et là, rentrera en jeux la compétence primordiale pour une agence de référencement de base :  faire comprendre que le référencement c’est dur, long,  qu’il faut patienter ou réinvestir, que la vie c’est dur, que mon chat a vomis ce matin au petit-déjeuner et que je n’ai plus de sous-vêtements propres à me mettre. Poste important à l’heure actuelle donc, celui du charlatan (Bim ! deuxième pavé dans la marre).

Selon moi, et de ce que j’en tire de la conférence, il existe plusieurs solutions.

  • Solution 1 : Le client fait appel à un consultant en référencement qui participera en tant qu’arbitre à l’élaboration du projet et qui veillera à la mise en place technique de la prestation de référencement faite par {l’agence de référencement|les charlatans}. Bilan, le client ne se fera pas entuber, le consultant pourra affirmer et confirmer la qualité de la prestation.
  • Solution 2 : Le client fait appel à un organisme spécialisé en formation de responsable SEO afin d’obtenir cette compétence au sein de son équipe, pour avoir au sein même de l’entreprise les capacités à juger des prestations de référencement.
  • Solution 3 : Créer un nouveau type d’agence de référencement, spécialisée dans la gestion de projets SEO, qui elle-même choisi des prestataires de qualité pour chaque étape d’une campagne de référencement (et des étapes, il y en a…).

D’autres points de réflexion personnels :

  1. Il vaut mieux cumuler plusieurs prestations de Netlinking provenant de référenceurs différents, que de s’acharner avec un seul (qui finira par faire n’importe quoi tant il sera désespéré). Pourquoi ? Car chaque professionnel du Netlinking possède son « pool de référencement ». Je préfère cumuler 3 pools de référencement de qualité qui vont s’additionner, que de m’acharner avec une agence m’ayant promis la lune.
  2. Il vaut mieux penser le projet de référencement en terme de CA (ou à la limite de visiteurs si on a pas les compétences) que de positions Google. Mais quelle idée a-t-on eu de qualifier les prestations SEO en « positions Google ».  Clients, à quoi cela vous sert de gagner des positions sur les mauvais mots-clefs ? Avec des pages ne convertissant pas ? Faisant venir le mauvais type de public ? Bref, au final, une vraie campagne de référencement ce n’est  pas un gain de positions Google, mais une réelle stratégie pour augmenter son CA. C’est sûrement le 3e pavé dans la marre, car je sais pertinemment que les escrocs du référencement feront pale figure quand un client orientera sa campagne dans ce sens, et que les agences de référencement reverront leurs estimations à la baisse. Car au final, une « vraie agence » qui se veut complète, devra posséder de (trop) nombreuses qualités.
  3. Un dernier point pour conclure là-dessus. Un sondage publié par SEO Moz montrerait que les tarifs en vigueur pour une campagne SEO (qui souvent dure 6 mois à 12 mois) en France couterait autour de de 250-500 euros par mois (alors que les US sont plutot aux alentours de 1k à 5k….) ou 2-5k pour l’ensemble de la prestation. Client d’agence SEO, si tu payes moins de 2k euros par mois pour une prestation de référencement, ne t’attends pas à des résultats magiques si tu es dans un secteur concurrentiel. Le SEO subit un goulot d’étranglement, car plus le web se fait référencé, plus il faut se faire référencer pour apparaitre, et qu’au final, il ne peut en rester que… 10. Le bon équilibre entre puissance de référencement et optimisation de sa stratégie SEO afin d’obtenir un ROI efficace a un prix.

Pour conclure sur cette myriade de pavés, on adoucira le tout en disant que le point clef d’une bonne campagne SEO est la communication, qui est un réel souci à l’heure actuelle entre client et prestataire. Trop souvent, le client vient voir une agence de référencement en pensant que celle-ci s’occupera de l’ensemble du projet SEO de A à Z. Trop souvent, le client ne mettra pas assez de moyens pour optimiser son site web (optimisation onpage, orientation social networks, création d’un blog, community management, rédaction, etc) et suivre les recommandations. Trop souvent, le client ne comprendra pas que le « netlinking » pur et dur n’est qu’un levier parmi tant d’autres pour réussir sur le web et faire 1M de CA par an. Trop souvent, le référenceur ou l’agence de référencement acceptera tout de même de faire la prestation. Et trop souvent, il y aura 50% d’échecs.

Et l’after dans tout ça ?

Bref, après toutes ces conférences, réel bouillon de réflexions SEO, les participants du SEO Camp Day ont enclenché la deuxième partie d’un tel meeting : le restaurant, et l’after !

Changement d’ambiance… ! Et pas des moindres ;) .

Et c’est cette deuxième partie qui m’aura le plus marqué (dont certains moments se sont déroulés dans des conditions censurables). Bref, le SEO Camp Day, c’est avant tout de l’humain, de la rigolade, de l’échange, du vin, du foie gras, du champagne, de l’énergie…. On en retiendra un mot : la famille.

Alors Rudy, prêt pour l’after ?

Parmi les référenceurs, il y a beaucoup de travailleurs indépendants. Je l’ai été, travailler seul ou en petit groupe, c’est bien, se balader sur Twitter et les forums, ça fait avancer, discuter par Skype, c’est sympa, mais au final, rencontrer les gens, les écouter, confronter des visions du secteur, boire un coup et finir à l’envers, c’est un luxe dont on a la chance de pouvoir profiter. Comme dit plus haut, le référencement est un secteur complexe, toujours en évolution, et le maîtriser n’est pas simple, le vivre au quotidien encore moins. Clairement, le fait de se retrouver tous ensemble dans une ambiance des plus conviviales vous laissera des souvenirs mémorables et vous confortera dans l’aspect 200% communautaire du SEO Français (si on évite les embrouilles Twitter du dimanche pour certains…).

Au final, j’ai été très intéressé par les conférences SEO « bisounours » (dixit Rudy ;) ), charmé par toutes les personnes que j’ai eu l’occasion de rencontrer et subjugué par le … taux d’alcoolémie global des participants passé une certaine heure. Un marathon 13h00 – 6H00 qui est à vivre absolument plusieurs fois par an.

Je ne peux donc qu’inviter tous les référenceurs à participer aux prochains évènements organisés par l’association Seo Camp Day : Apéro, Camp Day, Campus, etc… Des évènements à ne pas manquer grâce à son staff remarquable et l’ambiance générée par ses participants. Association SEO Camp : http://www.seo-camp.org/.

]]>
http://www.backlinker.fr/seo-camp-day-toulouse-2012-compte-rendu/feed/ 29
Spin Matriciel : vers un content spinning anti duplicate content http://www.backlinker.fr/spin-matriciel-vers-un-content-spinning-anti-duplicate-content/ http://www.backlinker.fr/spin-matriciel-vers-un-content-spinning-anti-duplicate-content/#comments Thu, 13 Oct 2011 10:32:26 +0000 Backlinker http://www.backlinker.fr/?p=526 La création et gestion de contenu dans une campagne de référencement est clairement la tâche la plus chronophage, mais aussi la tâche la plus difficile à optimiser. Clairement, le content spinning est une solution pour accélérer le workflow en terme de création de contenu, mais la syntaxe et les interfaces utilisées pour content spinning de base ont leurs limites. Selon moi, un très bon masterspin est un texte où 90% des mots sont spinnés, avec 6 expressions synonyme par mot au possible. Cependant, en comparant des milliers de textes générés, on obtiendra tout de même des ressemblances d’expression à terme. Si demain je dois réaliser un masterspin que je souhaite publier sur 10000 pages qui seront indexées par Google, du duplicate sera forcément détecté, rendant ainsi moins efficace l’ensemble du réseau des 10000 pages.

De plus, le content spinning a parfois cette fâcheuse habitude de vouloir en faire trop, avec trop peu de moyens : il suffit de se balader sur les sites de communiqués de presse français pour voir des textes bourrés d’expressions « pseudo-synonymes », qui, enchainées, détruisent le sens de la phrase, rendant l’article non crédible aux yeux d’un éventuel modérateur averti ou des lecteurs. Trop de spin, tue le spin.

Bref, difficile de trouver un juste équilibre entre la quantité et la qualité quand on souhaite mettre en place le contenu de sa campagne SEO sur des milliers de satellites ou au sein d’un réseau.

Clairement, Google continue sa lutte contre l’automatisation, Panda (notamment aux US) étant une avancée vers un algorithme tolérant de moins en moins le duplicate content. Admettons que les petits ingénieurs en bermuda ait placé le seuil de tolérance à 60% d’unicité pour qu’une page passe sous les filtres duplicate de Google, il se peut très bien que demain Google décide de mettre la barre à 80% (et là je peux vous dire que ça va cartoucher sévère).

I – La valeur d’un spin

Alors c’est bien beau tout cela, mais comment sait-on si notre contenu spinné est bon ou pas ? Tout d’abord il faut savoir que le content spinning de qualité en France coute très cher, et que le spinning français est bien entendu beaucoup plus complexe que le spinning anglais. Il existe peu d’agences ou de freelances spécialisés dans la rédaction de masterspins, et il en existe encore moins de très bons. La content spinning est un domaine de spécialisation où la culture lexicale, l’experience du spinning, et la créativité sont d’indéniables critères de qualité. Le péon de base pensant faire du bon spin, il y en a plein (tout comme ceux qui pensent bien référencer ;p, désolé je suis d’humeur taquine).

Bref, en passant par une agence française spécialisée à 200% dans le content spinning, cela m’a permis de faire plusieurs tests. Tout d’abord, comme le dit si bien notre cher ami Papy Spinning, ne vous faites pas leurrer par les histoires de spinning Niveau 2, niveau 3, c’est du grand n’importe quoi, car mathématiquement, si vous avez un spin de niveau 3 avec chaque niveau seulement 2 expressions, ça ne vous avancera pas plus.

Après avoir commandé un masterspin français « de base » à 70€ les 400 mots (de base : 5 expressions synonyme sur 80% des mots), le genre de masterspin qui j’imagine est des plus répandus, je lance via notre cher outil TheBestSpinner (dont je publierai un test complet un de ces jours, car clairement, c’est l’un des meilleurs outils de spin à l’heure actuelle) l’analyseur de comparaison « Generate & Compare », ce dernier permettant de générer X échantillons et de comparer les taux d’unicité. Donc pour 70€, sur un échantillon de 10 spun articles, je me retrouve avec un pourcentage d’unicité pouvant tomber dans les 34%. Oh joie. C’est loupé pour la publication sur 1000 satellites.

Passons aux choses sérieuses. Je commande un spin de 400 mots de la plus haute qualité, la rolls royce du texte spinné, le coût : 200 euros. Sur un échantillon de 100 spun articles, je tombe à 63% d’unicité. Et je ne parle pas forcément du rendu, qui bien entendu, est tellement spinné, que l’ensemble du texte a une tournure bancale. Clairement, si avec ce texte, publié sur 1000 satellites, et que 10 des satellites truste toute la première page Google sur la requête cible, les résultats ne seraient pas crédibles aux yeux des visiteurs.

L’équilibre entre la {lisibilité|crédibilité} du texte, et l’{unicité|efficacité} de ce dernier vis à vis de Google est donc bien compliqué à trouver. Si demain je veux lancer des milliers de satellites qui seront lus par des visiteurs, le tout, à partir d’une seule source de contenu, comment faire ?

II – Le spin matriciel

Le but est donc de trouver une structure de contenu permettant de trouver un juste équilibre entre unicité de contenu et fluidité de workflow. La syntaxe du content spinning est trop limitée, et de plus, rapidement illisible pour le rédacteur.
L’objectif serait donc de faire évoluer cette syntaxe et de mettre un outil en place, permettant de multiplier les dimensions du content spinning : le spin matriciel (terme n’existant pas du tout d’ailleurs, inventé hier..) ou spin polymorphe.

Voici une image d’une eventuelle interface de content spinning matriciel :

Précisons un peu l’image :
- On crée X sujets de paragraphes
- Chaque paragraphe possède plusieurs versions spinnés
- Les paragraphes peuvent être optionnels ou interchangés de position avec d’autres
- Dans cet exemple j’ai mis seulement une seule phrase par paragraphe, mais il faut imaginer un bon paragraphe de 100 mots.
- Le concept peut être poussé plus loin via la construction de relations conditionnelles entre les paragraphes

Ce genre d’interface (à laquelle on peut ajouter de nombreuses options) permet clairement de développer un masterspin multidimensionnel, permettant ainsi de réduire encore plus le duplicate content. Certes, un tel outil demande une gymnastique supplémentaire pour le/les rédacteurs, mais en terme de workflow, si j’ai un texte avec 5 paragraphes indépendants, tous avec 10 version de spins, qui de plus, permet au rédacteur de se concentrer plus facilement sur le spinning du paragraphe lui-même, et non l’ensemble du spin, j’obtiendrai à coup sur un spin de meilleur qualité sur le plan du taux d’unicité, mais aussi sur le plan rédactionnel, car le rédacteur n’aura pas eu à faire 40 pirouettes d’expressions, mais seulement à spinner différentes version de paragraphes.

Poussons plus loin, si demain je lance une campagne SEO sur l’expression « Pink SEO », j’ai juste à définir une dizaine de sujets de paragraphes fonctionnant les uns avec les autres : introduction au Pink Seo, les avantages de faire du Pink Seo, combien coute le Pink Seo, le Pink Seo en France, etc. Mon interface admin étant connecté à une API d’outsourcing de textes, les paragraphes se font tous rédigés par des rédacteurs différents, et mes spinners internes s’occupent de spinner les paragraphes. Bilan : workflow fluide, peu couteux, contenu top unique, top lisible. Et vu que je suis un peu perfectionniste, je définis même la destination de chaque paragraphe : tel paragraphe sera utilisé dans les annuaires, ces 5 paragraphes dans les CP, tous les paragraphes seront utilisés pour les Blogs, etc. Une gestion de contenu ultra-centralisée permettant un référencement fluide et efficace.

III – Conclusion et ressources

Le content spinning est devenu une technique des plus utilisées dans le référencement. Même s’il est difficile d’évaluer précisément la puissance des filtres anti-duplicate de Google, les perfectionnistes souhaitant monter des réseaux efficaces basés sur une et une seule source de contenu propre (car l’idéal de l’automatisation est de se détacher de la production de contenu « sale » & bouillie de texte) pourront envisager de passer la seconde en mettant en pratique le spin matriciel, qui réduira de manière efficace le taux de duplicate content.

Si vous avez des ressources / articles / outils à partager avec les autres lecteurs, n’hésitez pas à les partager.
- Outil utilisé pour analyser le taux de duplicate : TheBestSpinner 3 (outil de spinning avec une interface très efficace)
- Blog français très intéressant sur le content spinning : http://www.webcontentspinning.com/ par Papy Spinning (@ContentSpinning)
- Test de TheBestSpinner 3 (sera publié dans quelques semaines)
- Guide du content spinning (sera publié dans quelques semaines)

]]>
http://www.backlinker.fr/spin-matriciel-vers-un-content-spinning-anti-duplicate-content/feed/ 29
ScrapeBox et Hrefer : quel scraper utiliser ? http://www.backlinker.fr/scrapebox-et-hrefer-quel-scraper-utiliser/ http://www.backlinker.fr/scrapebox-et-hrefer-quel-scraper-utiliser/#comments Thu, 29 Sep 2011 09:28:14 +0000 Backlinker http://www.backlinker.fr/?p=496 Scraper, harvester, récupérer des liens, des backlinks, du contenu, des images, etc…
Le quotidien des « pro » du scraping est un domaine bien particulier, et selon moi, bel et bien une spécialité à part requérant énormément de talent et d’expérience. Là où le gus de base arrivera à scraper 2000 bons contenus, un pro arrivera à en dégoter peut-être 10000… une différence non négligeable.

-

Avant de commencer cet article, petit rappel. Qu’est-ce que le scraping ?
 » Le Web Scraping (aussi appelé Harvesting) est une technique informatique automatisée pour récupérer du contenu ». (définition provenant de Wikipedia et un peu modifiée par mes soins)

La technique de scraping la plus employée pour le Black Hat Seo est bien entendu celle du scraping de SERPs (URLs de résultats de requètes de moteurs de recherche) permettant de récupérer des milliers/millions d’URLs, pour ensuite les réutiliser avec des scripts.
Exemple : si demain j’ai un script pour envoyer des commentaires sur les sites utilisant la plateforme WordPress et le plugin CommentLuv, je vais vouloir récupérer un maximum d’Urls où se trouvent le formulaire et le plug-in pour envoyer mes commentaires. Bref, une technique des plus connues, notamment avec le logiciel ScrapeBox, ce dernier étant sûrement le plus répandu.

I. Passons aux choses sérieuses

ScrapeBox est donc l’un des softs les plus connus pour scraper, il permet clairement en quelques minutes de configurer son projet et de scraper des dizaines de milliers d’url.
Cependant, contrairement à ce qu’on pourrait penser, ScrapeBox n’est pas le logiciel le plus puissant en terme de scraping d’Urls, et tous ne se valent pas. On pourrait comparer Scrapebox à la Wii du scraping : sympa, familial, pas cher, rapide, etc. Mais pas ultra-puissante / ultra hi-tech.

Selon moi, l’un des logiciels les plus puissants en terme de scraping est Hrefer : le scraper fourni avec Xrumer (que nous n’avons plus besoin de présenter je pense).

Alors, pourquoi tout le monde utilise Scrapebox ? Surement parce que :
- il n’est pas cher
- il est simple et rapide d’utilisation
- il est fourni avec un lot d’outils impressionnant permettant de gérer ses listes d’urls dans tous les sens
Le « couteau suisse », tel qu’on l’appelle.

Cependant, Hrefer permet :
- de largement dépasser les 200 connexions simultanées pour scraper
- d’ajouter de nouveaux moteurs de recherche (système de regexp, etc)
- de générer des listes combinées de mots clefs, permettant ainsi de faire des recherches sur plus d’un million de keywords très facilement (sous scrapebox ce n’est pas prévu pour)
- de filtrer seulement les bonnes urls fraichement scrapées via un filtre « inurl » (sieve filter)

Un petit schéma explicatif ne fait jamais de mal :

Scraping : différences entre ScrapeBox et Hrefer

En termes techniques, la puissance de Hrefer provient de son utilisation simple et efficace de fichiers au format TXT pour les mots-clefs (nommés Words dans Hrefer), les footprints (nommés Additive Words), les filtres ainsi que pour les résultats (LinksList), contrairement à ScrapeBox qui « charge » les listes TXT directement dans le logiciel, sachant que ScrapeBox est du coup limité à un chargement de 1 million de lignes. Tout comme Xrumer, Hrefer « parcourt » les fichiers TXT, permettant ainsi de s’attaquer à des listes sans limite. De plus, l’utilisation par Hrefer de « X footprints * X mots-clefs » permet par combinaison de générer facilement des listes de requêtes beaucoup plus importantes que ScrapeBox, qui se cantonne à un footprint et X mots-clefs.

Quelques précisions :
- Le sieve-filter de Hrefer permet de vérifier lorsqu’une url est scrapée si plusieurs mots sont contenus dans l’Url elle-même. Par exemple, si j’ajoute en sieve-filter « wp-signup » et « register », je suis certain de récupérer dans ma liste de résultats des urls du type : http://www.wordpress.com/register/, http://www.edublogs.org/wp-signup.php, etc. (petit clin d’oeil à cette bonne vieille requête qui ne sert plus trop à grand chose de nos jours hélas ;) )
- ScrapeBox limite au niveau logiciel le chargement de plus de 1 million de lignes (keywords, urls, etc). Par contre, on peut récupérer le fichier de résultats scrappés dépassant les 1 millions de résultats dans le répertoire « Harvester_Sessions ».

II. Le million, le million !

Bon, je vois déjà la moitié de la petite foule se dire : « mais je n’ai jamais eu besoin de plus d’un million de résultats… » Il est vrai que pour le scraping « de base », le million de résultat est une limite suffisante.
Cependant, le jour où je vous demanderai d’inclure dans une base de données toutes les Urls de profils Google Plus histoire de monter un super méga profil de la mort qui tue avec XXXX milliers de followers (je follow Danielle, elle me trouve beau car j’ai un hélicoptère Black Hat, elle me follow), le million devra être dépassé. Bilan, je chargerai une sacré liste de prénoms / noms avec les footprints Google plus, et bim, j’enverrai la sauce, je me retrouverai avec des centaines de millions d’urls de profils, que je pourrai utiliser pour vendre mon Ebook que je n’ai toujours pas écrit. Bref, le million c’est bien, parfois, plus c’est mieux. (PS : cet exemple est pure fiction et n’est pas à reproduire chez soi, car dangereux)

Idem, si demain j’attaque la jolie niche Poker en ligne, cela pourra être intéressant de récupérer des millions de Backlinks de milliers de concurrents, de balancer le tout dans un analyseur de plateforme, et de poser mon lien sur les plateformes Web 2.0.

Bon j’arrête avec les exemples ;) , mais vous imaginez donc bien que scraper plus d’un million de résultats peut-être extrêmement important quand on souhaite passer la deuxième vitesse.

III. ScrapeBox et Hrefer, la combinaison

ScrapeBox n’est cependant pas à jeter à la poubelle, au contraire. Je l’utilise au quotidien, ne serait-ce que pour toutes ses fonctions de gestion de liste d’urls (check links, remove duplicate, link extractor, outbound linkchecker, et j’en passe). Idem, son utilisation très rapide permet de lancer des petites phases de scraping en un clin d’oeil.

Toutefois, pour les projets de scraping de grande envergure, où je souhaite obtenir un maximum de résultats probants, j’utiliserai Hrefer, qui est une sorte de sniper/sulfateuse russe (avec mode d’emploi russe pour le coup), et là dessus, on ne peut que prôner l’efficacité des logiciels Botmaster.

IV. Ressources

  • ScrapeBox coûte la modique somme de 57$, si vous ne le possédez pas encore, je ne sais pas ce que vous faites sur ce blog ;) . Voici l’adresse pour l’acheter : http://www.scrapebox.com/bhw.
  • Hrefer est fourni avec Xrumer, et vous vous débrouillerez pour l’acheter si vous le souhaitez (qui en soi est un peu un casse tête quand on ne connait pas).
  • Il existe un logiciel de Scraping gratuit pour ceux qui souhaitent débuter : http://sickmarketing.com/beta/scraper.exe (Guide d’utilisation)
  • Il existe de nombreuses manières permettant de créer des scrapers de manière plus spécifiques (contenus, images, lapins crétins, etc), on pourra penser à Ubot, ZP, etc. Ou tout simplement à un script PHP cURL multithread utilisant des proxys, via Xpath (coucou Beunwa) ou les expressions régulières.

Comme je disais plus haut, le scraping est une compétence à part, et même si elle est accessible facilement au début, la maitriser totalement demandera beaucoup de temps et d’ingéniosité.

Quelques astuces en vrac :

  • Sur quelques footprints me permettant de scraper un type de plateforme, si je la combine avec site:fr, site:org, site:com, etc, j’obtiendrais plus de résultats
  • Sur quelques footprints me permettant de scraper un type de plateforme, si je la combine avec 10K mots-clefs courants, j’obtiendrais beaucoup plus de résultats
  • Si je souhaite scraper que du francais, je ferai en sorte de scraper google.fr?hl=fr (possible sous ScrapeBox et Hrefer), histoire de ne pas spammer en Francais des sites anglais, et vice-versa
  • Je peux scraper via Google avec certains filtres (options de gauche dans Google) : blogs, discussions, urls indexées depuis 1 an, 1 mois, etc
  • Via Google, je peux target une géolocalisation spécifique en utilisant google.com?hl=ru&gl=ru (vive la Russie)
  • Il n’y a pas que 4 moteurs de recherche dans le monde (l’astuce à 1 milliard de dollars)

Si vous souhaitez partager des astuces sur le scraping, n’hésitez pas à les mettre en commentaires, je les inclurai dans l’article avec une jolie photo de vous.

A vous les studios ;) .

]]>
http://www.backlinker.fr/scrapebox-et-hrefer-quel-scraper-utiliser/feed/ 15
AWM Proxy fermé, le service utilisait le réseau botnet TDL-4 http://www.backlinker.fr/awm-proxys-ferme-le-service-utilisait-le-reseau-botnet-tdl-4/ http://www.backlinker.fr/awm-proxys-ferme-le-service-utilisait-le-reseau-botnet-tdl-4/#comments Mon, 19 Sep 2011 08:13:27 +0000 Backlinker http://www.backlinker.fr/?p=486 Des services de proxys, il y en a de nombreux, des bons, des moins bons, et il y en avait un qui était particulièrement exceptionnel : AWM Proxy. Un service de proxys géré par des Russes, proposant plus de 3000 proxys de qualité exceptionnelle. (Très bon temps de réponse, gestion de tous les protocoles, de nombreux proxys européens, etc) AWM proxys proposait ce service pour un abonnement mensuel de 99$, là où d’autres services font payer 800$, voire plus, pour accéder à seulement 1000 proxys. Enorme différence en terme de qualité et de prix.

Cette semaine, ce service s’est fait « shooter », voyant ainsi disparaitre leur site web, et leur serveur gérant et centralisant les données des proxys.

En me renseignant un peu, il s’avère que AWM proxy n’était pas un service de proxys comme les autres. Les autres services de proxys sont « légaux », dans le sens où des serveurs multi-ip sont mis en place pour servir de passerelle de trafic. (corrigez moi si je me trompe) Quant à AWM proxy, en lisant l’actualité suite à la coupure de leur réseau, le service a en fait été décelé comme utilisant un botnet, un vaste réseau de PC zombis porteurs d’un virus Windows, plus connu sous le nom de botnet TDL-4,  permettant via un fichier socks.dll de servir de passerelle réseau et donc de proxys…. Bien entendu, je ne pense pas que les clients de AWM proxy étaient au courant de cette manigance, et j’avouerai que j’ai à la fois été choqué et surpris par l’ampleur de la  chose mise en place.

Voici plus de détails sur le virus et réseau botnet TDL-4 en question :
- Il a fait la une et le buzz fin juin 2011, étant qualifié de réseau botnet quasi-indestructible
- TDL-4 infecte le  master boot record (amorçage du système d’exploitation) de l’ordinateur par un rootkit où le malware se cache pour prendre le contrôle de l’OS.
- 4,5 millions d’ordinateurs seraient infectés
- Environ 10 requêtes internet par minute sur les PC infectés
- Il est utilisés à priori pour lancer des attaques en DDOS ou faire des campagnes de spam et de phishing, en plus du service de proxys
- Un service d’affiliation fait rapporter entre 20 et 200$ pour 1000 installs. Bilan : les sites pour adultes et les sites de téléchargements illégaux sont les premiers distributeurs de ce virus (sûrement la raison numéro 1 d’une telle domination du virus)
- Les données communicantes entre les bots et le centre de commande du botnet sont indécelables à priori
- Capacité d’échapper aux anti-virus…
- Supprime les autres virus concurrents…..
- Plus de 100 000 PCs seraient infectés en France.

Personnellement, je suis en contact avec quelques russes, et il faut savoir que la notion de Black Hat (ou même Black Hat Seo) est totalement différente et beaucoup plus « hardcore » et illégale que celle en France. En France, parmi les Black Hat Seo que je connais, personne n’a jamais évoqué des activités de Hacking, Scamming, Phishing, etc. Et tant mieux ;) .

PS : comme tout service russe, il se peut que AWM proxy revienne parmi nous plus tôt que prévu. Qui vivra verra.

]]>
http://www.backlinker.fr/awm-proxys-ferme-le-service-utilisait-le-reseau-botnet-tdl-4/feed/ 18
Ahrefs sort un outil d’analyse de position gratuit http://www.backlinker.fr/ahrefs-sort-un-outil-innovant-danalyse-de-position/ http://www.backlinker.fr/ahrefs-sort-un-outil-innovant-danalyse-de-position/#comments Wed, 07 Sep 2011 09:15:39 +0000 Backlinker http://www.backlinker.fr/?p=464 Oyé oyé à la population. Voici une petite news intéressante pour les perfectionnistes du SEO, d’audit, et autres. Pour ceux qui ont toujours voulu savoir comment se positionne un Nom de domaine sur toutes les requêtes lui générant du potentiel trafic, Ahrefs (gros moteur d’analyse de backlinks à la base) sort un outil que je trouve très intéressant, permettant en tapant simplement l’adresse de son site web de générer la liste des mots-clefs et des positions associées au nom de domaine, gratuitement. Bilan, il ne s’agit pas de vérifier des requêtes spécifiques, mais bel et bien de voir sur quelles requêtes notre site web se positionne, le tout classé par score (équation entre position actuelle et trafic global du mot clef).

Pour accéder à ce service totalement gratuit, il suffit de :
- Se rendre sur http://ahrefs.com/serps/positions/
- Taper l’adresse de son nom de domaine
- Et sélectionner l’onglet Google et l’option FR

Ce qui vous donnera par exemple des résultats très intéressants (pour backlinker.fr ça l’est un peu moins, mais j’ai testé sur d’autres NDD) :

Pourquoi ce service est-il intéressant  ?

Car il vous permet facilement de détecter les mots-clefs à booster pour gagner du trafic de qualité, en un clin d’oeil, en vérifiant la position actuelle, le volume de recherche, le CPC, etc. Clairement un outil puissant, permettant de prioriser certains mots-clefs qui rapporteront plus, plus rapidement. En le couplant avec la technique des mots-clefs Adwords, du trafic réel via Google Analatics, on obtient toutes les données pour une stratégie SEO évolutive. Vous pouvez également étudier la concurrence, ce qui permettra de définir un bon nombre de mots-clefs rentables. Exemple : je me lance dans le secteur du mariage, j’étudie les concurrents principaux, je récupère une liste de mots-clefs intéressantes, qui me permet d’orienter mon contenu facilement vers des mots-clefs rapportant du bon trafic, et en avant le deeplinking.

Bien entendu, ce service est utile que sur des NDD déjà positionné dans Google. (cela va de soit, Akinator ne s’étant pas encore lancé dans ce type d’outil…).
On notera également qu’il faut s’enregistrer gratuitement pour avoir accès à plus de 3 requêtes par jour.

A noter, suite aux bons commentaires de certains :
- SEMRush propose le même service, mais payant (limité à 20 results en gratuit).
- Une extension « Rank report » sous wordpress permet également d’afficher de telles données (merci @fred)

]]> http://www.backlinker.fr/ahrefs-sort-un-outil-innovant-danalyse-de-position/feed/ 40 2012 : l’année du bouleversement SEO ? http://www.backlinker.fr/2012-bouleversement-seo/ http://www.backlinker.fr/2012-bouleversement-seo/#comments Tue, 06 Sep 2011 11:07:14 +0000 Backlinker http://www.backlinker.fr/?p=434 Oyé oyé :) . Cela faisait longtemps que je n’avais pas publié d’article sur ce petit blog. Je vous avouerai qu’il y a plusieurs raisons à cela, la première étant que je prépare une refonte de ce blog, afin de fournir un contenu plus riche et poussé, touchant le SEO de A à Z, pour le plaisir de certains. Entre deux trois constructions de réseaux, plusieurs formations, et autres tests de netlinking, je prends le temps de rédiger ce ‘petit’ article, notamment pour réagir à l’actualité en cours, lancée par Google et extrapolée par certains blogs. Âmes sensibles s’abstenir, la suite du poste est un peu plus direct que d’habitude (j’arrondis moins les angles…).

Cet été nous avons eu droit à notre jolie mise à jour Google Panda, qui aura tant fait parler d’elle, et qui au final, n’aura été qu’une vaste fumisterie pour dégommer des sites web de certaines niches (où comme par hasard Google cherche à s’introduire, mais bon, la théorie du complot ne m’intéresse pas ;) ), ou des sites mal foutus (10K pages indexées avec pour contenu un texte et deux trois variables qui changent…). Bref, honnêtement, Google Panda aura bien fait rire certains BH je pense.

La dernière actualité du moment et qui semble une fois de plus faire frémir les SEO : Google annonce qu’il affichera dans GWT (Google Webmaster Tools) les sous-domaines d’un NDD donné comme des pages internes au site. Déjà, pour ceux qui prennent le temps de lire l’article de Google, on parle de GWT, et non d’algorithme de SERPs… Cet article est repris et analysé par Arobasenet (http://www.arobasenet.com/referencement-google-declassifie-sous-domaines-02092011.html), et retweeté 200+ fois. Une fois de plus, comme après chaque annonce de Google, nous avons l’impression qu’un tremblement de terre s’en suit, qu’il faut commencer à se pointer au pôle emploi pour trouver un métier plus sûr, car après tout, Google nous met tellement la pression qu’on en développe des ulcères à l’estomac. Alors qu’au final, pour cette annonce, les sous-domaines ne perdent pas de valeur vis à vis de l’algo comme on pourrait le lire, jusqu’à preuve du contraire. Edit technique, et empirique : Un sous-domaine est indépendant en terme de référencement de son domaine (il faut le référencer comme un domaine à part), et ne bénéficie pas d’héritage de son domaine (si je créé un sous-domaine sur un domaine PR9, je ne bénéficie pas du PR, à moins bien sur de faire un lien du domaine vers le sous-domaine). Par contre, un sous-domaine n’aide pas à « référencer » son domaine principal, sauf en créant un lien, qui n’aura pas plus de valeur qu’une page interne selon moi, et ce, depuis longtemps. Honnêtement, si je me permets aujourd’hui de faire ce post, qui semblera peut-être un peu déplacé, c’est pour remettre deux trois choses à leur place. Google n’est pas con, mais Google n’est pas ‘almighty’, Google n’est pas un algorythme flou à la Rothko, … Certes Google possède un nombre de filtres importants, mais le décalage entre les annonces de Google et la crédibilité voire l’extrapolation qu’on leur donne est à mon gout déconcertante.

Soyons concrets, si aujourd’hui vous achetez 1000 noms de domaines, et que vous les mettez en place intelligemment, vous dégommerez tout ce qui bouge. C’est ça google : NDD = vote = popularité = ranking = trafic = thunes. (je schématise un peu). Et vous me direz : oui mais il faut 1000 ip … ? Et je répondrai non, c’est du flan cette histoire, une fois de plus. (en terme de référencement) Google (et/ou du moins les gens qui suivent l’actu Google) alimente une forme d’aura d’épée de Damoclès, mélangé à un soupçon de sorcellerie, mais selon moi, il faut savoir s’en détacher assez rapidement. Google n’est pas une secte ou un gourou, et j’ai l’impression que les SEO francophones entretiennent cette atmosphère. Il faut également savoir se détacher de ce qu’on peut lire, ne pas crier alélouia à chaque fois qu’on lit un article sur quelque blog qu’il soit (celui-ci compris), où quand on regarde une video de Matt Cutts qui dit tout simplement n’importe quoi, sûrement pour embrouiller les esprits plus qu’autre chose. Le SEO, c’est un algo, et cet algo, c’est avant tout en pratiquant (si possible à grande échelle) qu’on commencera à le cerner.

Certains ont peur de voir leur sous-domaines considérés comme des pages internes, alors que d’autres actualités sont beaucoup plus intéressante, et pour le coup, ces dernières doivent faire paniquer certains ingénieurs en bermuda chez Google. La première est clairement l’arrivée le 12/01/2012 de la demande création de TLD (top-level domain, exemple : .fr, .biz, etc) par les organisations et compagnies, avec à priori une arrivée d’entre 300 et 1000 nouveaux TLD assez rapidement. Si demain un investisseur me permet de choper pour 185K USD un TLD, je deviens registrar. Je deviens registrar, je lance 1 million de NDD basés sur des scripts BH de haut niveau pour avoir un réseau de sites indépendants de mégalomane et j’offre un service de création de NDD gratuit avec publicité afin de noyer le poisson et de toucher des thunes par Google (paradoxe quand tu nous tiens). Avec une certaine habilité (seuls de très bons BH/dev pourront passer les filtres) de mise en place d’un tel réseau, Google ne peut ou pourra rien faire. Il ne faut pas chercher loin pour voir cette mouvance actuelle, certaines niches se font arrosées de réseaux de 1K NDD basés sur des scripts qui sont honnêtement de moyenne qualité, et pourtant, Google se fait complétement assommer (pour peu qu’on utilise pas des scripts tout faits comme WPMU par exemple). Google prend clairement à l’heure actuelle comme critère numéro 1 le nombre de NDD referers (et non d’ip referer, qui selon moi est un critère moins important qu’on pourrait l’entendre). Mais en 2012, avec, forcément, une popularisation des TLD, et des offres qui iront du NDD pour 2$ au gratuit à coup sûr, Google l’aura dans l’os complet. On peut d’ores et déjà imaginer que les ingénieurs s’y préparent, et vont s’orienter vers un SEO de plus en plus équilibré entre le nombre de NDD referrer et le nombre d’actions ‘humaines’ (sachant qu’on peut d’ores et déjà acheter 10K votes google + sur le web…).


Mon BH en 2012…

Le futur du référencement, c’est le développement de réseaux, factices ou non, peu importe tant qu’ils sont bien conçus. Pour le BH, il s’agira de plus en plus de monter des réseaux de ‘personnes/blogs/guides/etc’ factices et non dénonciables, et de simuler un maximum d’actions humaines. Si vous voulez assurer votre référencement BH de demain, vous montrer 1K nom de domaines (visuellement/lexicalement totalement crédibles et différents les uns des autres), 10k comptes twitter & google + & FB... et puis voilà. Et vous arrêterez de regarder Google Webmaster Tool, et vous rigolerez quand Matt Cutts sort une vidéo pour parler de DMOZ…

Voilà, une fin d’article un peu ‘virulente’ & metling-pot et je m’en excuse =). (heureusement, il y a les lapins crétins)

Ressources :
- Bon article (d’un point de vue subjectif) sur l’annonce de Google pour les sous-domaines : Axenet
- Très mauvais article (d’un point de vue subjectif) sur l’annonce de Google pour les sous-domaines : Arobasenet, http://www.arobasenet.com/referencement-google-declassifie-sous-domaines-02092011.html (pas de backlink pour les mauvais articles :p)
- Démenti par Google sur un potentiel changement de prise en considération des sous-domaines par l’algo de recherche
- Article sur l’annonce de l’ICANN sur la démocratisation des TLDS

]]>
http://www.backlinker.fr/2012-bouleversement-seo/feed/ 59
Le cyborg, le futur du Black Hat http://www.backlinker.fr/le-cyborg-le-futur-du-black-hat/ http://www.backlinker.fr/le-cyborg-le-futur-du-black-hat/#comments Fri, 08 Jul 2011 09:34:29 +0000 Backlinker http://www.backlinker.fr/?p=382 Oyé oyé !

Voici un article que je souhaitais lancer depuis déjà plusieurs semaines, mais que j’ai laissé un peu au fond de ma poche le temps de le faire mûrir. Ceux qui ont lu mon compte-rendu sur le Barcamp BH à Toulouse ont pu sentir mon intérêt pour le concept du Cyborg, qui selon moi, est une avancée en terme de BH à ne pas mettre de coté.
Il s’agit d’un article théorique ma foi assez complexe, mais que j’essayerai de rendre le plus ludique possible, tout en tentant de transmettre au maximum l’idée principale du concept.

Alors commençons !

Tout d’abord, deux définitions :

Un robot est un dispositif mécatronique (alliant mécanique, électronique et informatique) accomplissant automatiquement soit des tâches qui sont généralement dangereuses, pénibles, répétitives ou impossibles pour les humains, soit des tâches plus simples mais en les réalisant mieux que ce que ferait un être humain.

Le mot « cyborg » est devenu une expression courante. Cependant, son sens a largement dévié depuis. Dans le film Terminator, il est employé pour désigner un robot, non seulement à l’apparence humaine, mais dont l’enveloppe extérieure est faite de tissus organiques de synthèse (à l’origine faite pour soigner les blessures humaines). Depuis, il est devenu courant d’utiliser « cyborg » comme synonyme de « robot androïde ».

Je confronte donc dans cet article deux concepts : le robot et le cyborg.

Pour bien se comprendre, je résumerai la chose par :
- le robot effectue les tâches qu’on lui donne
- le cyborg est capable de gérer l’ensemble des tâches, de les redistribuer, le tout intelligement. Le cyborg possède donc une « IA » (Intelligence Artificielle) beaucoup plus évolué que le robot.

I. Pourquoi parler de Cyborg ?

Le référencement ne cessera de se complexifier sur les années à venir. Là où un ou deux boutons pouvait suffir pour lancer un « blast » et ranker, plusieurs indices montrent clairement une évolution dans le monde du SEO visant deux choses : en finir avec le Spam (toujours et encore), et donner du pouvoir de vote aux humains. Donc petit à petit, là où le vote était un lien sur un site web, demain, un vote sera surement un Buzz sur Google +.

Quelques indices ces derniers mois sur des points importants chez Google :
- Mise en valeur de manière considérable d’un point de vue marketing sur le Social linking (Tweets, FB Likes, Google +1, etc)
- Décapitation des sites avec plusieurs centaines de milliers de pages à faible densité de contenu ‘fermes de contenu’ via l’update Panda (pas encore arrivé en france)
- Suppression de 11 millions de sous-domaine .CO.CC, l’hébergeur pseudo gratuit de sous-domaine le plus populaire, véritable machine à spam
- Buzz marketing sur le fait que Google active un nouveau levier de vitesse dans sa lutte anti-spam : communiqué proclamant officiellement le droit de désindex tout un nom de domaine, envoi de mails via Google Webmaster Tools pour alerter d’une pénalité suite à des liens spammys, plus de protections anti-scrapper du moteur de recherche, et j’en passe..
- La phase de buzz Blekko versus Google et le buzz journalistique sur la mauvaise qualités des SERPs Google (sûrement un des points qui a accélerer les choses)

Dans notre métier/passion de référenceur, on ne peut passer à coté de tant de marqueurs accumulés, et la sortie de Google Plus (pour ceux qui sortent de leur grotte, il s’agit du concurrent numéro #1 de Facebook) avec les rumeurs des changements de noms pour Blogger et Picasa montrent clairement une chose : à travers l’analyse de tous nos agissements sur le Web (en achetant sur google shopping, en buzzant sur Google+, en uploadant des images, en bloggant, en analysant le/les IPs de l’auteur de chaque action, etc), Google manœuvre vers une ultra-centralisation des données du Web sur ses serveurs. Pourquoi ? Car celui qui aura le plus de données sur ses propres serveurs, mis à part pour des raisons de gains publicitaires/économiques, sera à même de sortir les meilleurs résultats dans les moteurs de recherche. Rien que cette dernière phrase pourrait faire le sujet d’un article entier, mais restons sur nos moutons ! (déformation linguistique sympathique) Google veut devenir un énorme cerveau, et nous serons chacun un petit neurone travaillant pour lui !

II. Rendez nous nos lapins crétins !

Oui oui bon… j’étais un peu en mode annonciateur du chaos dans le paragraphe précédent.. Bref.

Tout cela pour dire, qu’à terme, le Black Hat devra sûrement utiliser des techniques de plus en plus « Hi-Tech ». Faut vivre avec son temps hein !

Pour changer un peu de mes articles précédents, voici la suite de l’article en images… c’est parti !


Le Black Hat en 2010-2011
A l’heure actuelle, la majorité des Black Hat utilisent des robots qui leur permettent d’automatiser les tâches. Cependant, cette technique à de nombreuses limites : suivi des résultats/urls manuellement, nombres de projets à gérer, interlinking des listes d’urls, difficulté de travailler sur plusieurs niveaux, gestion temporelle (un blast reste un blast est n’est pas continu), etc. Si demain je donne à ce black hat 200 sites à référencer/buzzer, il pétera un plomb…


Le cyborg : le futur du black hat
Notre cyborg, dument programmé avec une IA digne d’un terminator (quoique, il est un peu bêbête le terminator), est tout simplement notre centre névralgique qui définit automatiquement les tâches des lapins crétins (qui sont nos robots). Chaque lapin crétin pourra ainsi se voir assigner un projet orienté émulation humaine/SEO/SEM afin de gérer l’ensemble de nos projets. Grâce à un système communicant, le lapin recoit ses consignes, le cyborg recoit les résultats, et à partir de ces derniers, déterminent de nouvelles consignes. Plus le cyborg sera bien programmé et complet, plus il nous permettra de devenir riche tout en buvant des mojitos à la plage.


Le cyborg se doit d’analyser minutieusement les résultats retournés, afin de pouvoir donner les meilleurs consignes pour la suite.  Plus le cyborg est apte à donner une consigne pour contrecarer un mauvais résultat, plus le cyborg sera intelligent. A terme, ce concept permet également au cyborg d’évoluer, si possible automatiquement ou le plus simplement possible, afin d’avoir une IA évolutive sur le long terme. Dans cet exemple, on met clairement en avant plusieurs critères de plus en plus importants : l’humain, les réseaux sociaux, la gestion temporelle (il vaut mieux diluer les invitations reseaux sociaux, la publication d’articles, la création du netlinking, etc pendant 2 mois qu’en 1 jour). Le naturel avant tout.


On notera également le soucis de la diversité des tâches. Plus le cyborg est apte à donner des tâches différentes et simili-humaine, plus l’ensemble des actions de notre lapin crétin paraîtra naturel.


Bien entendu, pour boire des mojitos sur la plage, il faut de l’argent. Notre cyborg a clairement cette finalité, et l’ensemble des consignes permettront à terme de gagner un peu d’argent !


Grâce au cyborg, notre lapin crétin deviendra rentable de manière exponentielle ! Et ça… c’est important…


Et pour conclure cet article en image… cette dernière parle d’elle même.
Une autre donnée importante est le fait que notre Cyborg puisse interlinker nos petits lapins crétins entre eux. Telle une société idéale, si un lapin est en galère, mon cyborg dira aux autres de l’aider ! Elle n’est pas belle la vie ?


III. Conclusion

Sous ces allures de SF comico déglinguées, ce type de projet n’est pas farfelu pour un sous, et peut mener directement à la caverne d’Ali Baba. En schématisant un workflow d’une manière globale, on peut automatiser aux maximum ce dernier. Si demain j’ai 1000 blogs, et que je dois publier des articles intéressants/vrais, je connecterai mon cyborg à ma/une plateforme d’outsourcing afin de demander la rédaction de ces derniers, et de les publier automatiquement une fois validés.

Le Cyborg n’est autre qu’un concept de l’industrialisation et de l’automatisation : réduire au maximum les interventions humaines, booster au maximum l’automatisation des tâches, et gérer leur déroulement sur la globalité du projet. Clairement, la conception d’un cyborg demande de nombreuses compétences, et sera idéalement réalisé par une équipe bien spécialisée : programmation, sémantique, rédaction, SEO, SEM, marketing, etc.

Qu’en pensez -vous ? ;)
Retweeter cet article

]]> http://www.backlinker.fr/le-cyborg-le-futur-du-black-hat/feed/ 89 Changement d’algo Google et fin du Pandaranol ! http://www.backlinker.fr/changement-dalgo-google-et-fin-pandaranol/ http://www.backlinker.fr/changement-dalgo-google-et-fin-pandaranol/#comments Wed, 22 Jun 2011 09:13:32 +0000 Backlinker http://www.backlinker.fr/?p=366 Oyé Oyé  ! Ces dernières semaines du mois de Juin sont pleines de remous ! Fête de la musique sous la pluie, examens foirés pour ceux qui sont encore étudiants, mon poisson rouge qui a vomi…. et … deux points importants qui par coincidence se croisent :

- Un gros débat sur ce qui semble être un début de changement d’algorithme Google
- Et du gros changement dans les SERPs pour la fin du concours Pandaranol

Coincidence, quand tu nous tiens !

I. Le buzz de la fin du Pandaranol

Avant de commencer cet article, vu que le concours Pandaranol prend fin dans 10 jours très exactement, que les résultats sont en plein changements, et qu’il est impossible de pronostiqué qui sera le grand gagnant de ce concours SEO, on a réalisé un petit plug-in wordpress pour que vous puissiez afficher sur votre blog WordPress les résultats en live (mis à jour deux fois par jour) . Ce petit plug-in mignon, vous pouvez le voir à droite sur cette même page.

Pour installer le plugin Pandaranol – Suivi Seo Worldcup, rien de plus simple :
1 – Télécharger le fichier seoworldcup.rar (1 KO…), et le décompresser.
2 – Placer le fichier seoworldcup.php dans le répertoire « wp-content\plugins » de votre blog WordPress
3 – Activer le plugin « Pandaranol – Seo World Cup » dans les Extensions et placer le widget

Voilà, cela permettra à tous vos visiteurs de suivre la fin du concours qui est on ne peut plus mouvementée ! Et de faire tourner un peu le buzz sur notre communauté SEO pendant ces derniers jours de concours :) .

II. Google, changement d’algorithme ?

Allez hop, je mets les pieds dans le plats.

Pour tout vous dire, le lundi 20 mai 2011, comme chaque matin, j’ai regardé la page de résultats du Pandaranol. Certains résultats m’ont vraiment interpelé. Par exemple, http://koolioo.com qui était un duplicate sans backlink de http://www.koolioo.com (redirigé vers www.coolioo.fr) qui venait d’arriver dans le top 3 du Pandaranol. Pourquoi ? Bizarre…

Puis, plusieurs autres noms de domaines (non participants car créés avant le concours) qui n’avait pas forcément grand chose à faire sur la premiere page :
- littlestar.fr de @Nikolittlestar qui était premier… Je lui ai demandé s’il avait bourriné cette page, il m’a répondu que pas du tout et que c’était une grande surprise pour lui :)
- insomniedugeek.fr … première page, et pas réellement de raison d’une telle montée.
- L’article journaldunet.com sur le lancement de la Seo Worldcup… idem première page…

Bref, forcément, tant de changements en 24h, cela met la puce à l’oreille. C’est alors que je tombe via Twitter sur l’article de notre cher Olivier Duffez de Webrankinfo (fuck je parle de WRI sur mon blog :p), intitulé « Gros changements Google« , publié le jour même, lundi 20 Juin 2011, qui semble confirmer que sur certains secteurs (j’imagine que google est largement capable de déployer des algos seulement sur certaines niches), il y a de fortes modifications dans les SERPs. Du coup, nous avons droit à une très grande discussion sur les forums de WRI : 17 juin 2011 – Journée noire, chute de trafic, longue de 9 pages. Ca rigole pas, certains ont perdu pas mal de trafic ! (et bien entendu, certains en ont gagné, mais ils s’exprimeront surement moins sur le sujet)

Certes, ce n’est pas le lancement officiel de Panda (sinon on en aurait entendu parlé..), mais il semblerait bel et bien que des changements soient en cours. Un déploiement pseudo-furtif… Par hasard, cela tombe pendant la fin du concours Pandaranol, et je vous invite à lire cette fraîche et jolie interview d’un ancien employé Google travaillant dans le département anti-spam, où il déclare tout simplement que les concours Black Hat sont totalement pistés par Google pour améliorer leur algorithme,  leur permettant ainsi de voir en peu de temps ce qui peut se faire en terme de netlinking de nos jours dans le monde obscur des BH.  Même si ce n’est pas étonnant, c’est toujours bon de savoir officiellement qu’on nous colle aux fesses :p. Vivement la retraite ! Après, je pense que la corrélation entre changements d’algos et concours français Black Hat s’arrête là (car après tout, c’est sûrement Google US le décisionnaire), mais la coïncidence reste titillante dans tous les cas.

La conclusion de ce paragraphe pourrait être : profitez bien des vacances, car à votre retour, il risque d’y avoir du changement dans la manière de caresser Google dans le bon sens du poil. (Ca me fatigue rien que d’y penser :p). Cependant, restons lucides, un schéma de référencement efficace existera toujours, quoi qu’il se passe. Si demain il faudra 1K retweet, facebook shares, Google +1,  les BH apprendront et sauront créer des fakes comptes à autorité pour gérer ce facteur de référencement. A chaque nouveau besoin se créer de nouvelles techniques. Adaptation et survie :p. (Une petite pensée pour les dinosaures d’ailleurs svp)

D’ailleurs, si de votre côté vous avez vous aussi pu apercevoir ces changements dans les SERPs, je vous invite à décrire de manière complète votre vision de ce potentiel changement en cours, via les commentaires.

III. Pandaranol, ça fight sec !

Bon, revenons à notre cher Pandaranol qui prend fin dans 10 jours. Autant le dire, je suis assez surpris des résultats actuels, totalement imprévisibles. La fin du concours risque d’être encore plus intéressante qu’une fin de saison des feux de l’amour. Tout d’abord, nous avons eu droit à une montée fracassante de dontbeevil.fr, qui n’est autre que le nom de domaine de Paul de SeoBlackOut, nom de domaine qui a eu droit à une sacrée redirection d’un nom de domaine à forte autorité. Cependant, impossible de pister puisque la redirection 301 est cloackée. Du coup, seul Google peut la voir :p.

Comme vous avez pu le voir, contrairement au concours Seotons, Pandaranol met largement (très largement…) en avant les redirections 301, technique pour transmettre du jus positif vers votre domaine cible. Une technique de plus en plus en vogue… Et qui nous l’espérons, durera longtemps :p.

Puis aujourd’hui, l’escalade du Pandaranol continue, avec petit-panda.com qui débarque tout simplement en première position, d’un coup. Bim bam boum, est-ce que cela durera.. pas évident à deviner. Et le-fada.com qui pointe le bout de son nez en première page. Alors que dans mon article précédent, fautquecajarte.fr et pandaroux.fr faisaient partie des leaders du concours, nous avons droit à un renversement de situation assez fou. Moi je vous le dis, @Bertimus doit être aux anges :p et se frotter les mains, le saligo. Du coup, autant les premières semaines du Pandaranol n’étaient pas forcément excitantes en tant que spectateur, autant le sprint final est digne d’un blockbuster.

Voilà voila, sur ce, je retourne à mes vagues occupations ! N’oubliez pas de poster un commentaire pour dire ce que vous pensez de ces changements tant pour le Pandaranol que Google, et n’oubliez pas également d’installer le plug-in pour afficher les résultats pour faire de cette fin de concours un buzz SEO digne de ce nom.

]]>
http://www.backlinker.fr/changement-dalgo-google-et-fin-pandaranol/feed/ 66
Mininet.fr : nouveau service de référencement http://www.backlinker.fr/mininet-fr-nouveau-service-de-referencement/ http://www.backlinker.fr/mininet-fr-nouveau-service-de-referencement/#comments Thu, 09 Jun 2011 10:57:36 +0000 Backlinker http://www.backlinker.fr/?p=336 Oyé Oyé les foufous du Web !

Aujourd’hui est un grand jour pour moi, car après deux mois de mise en place, je lance avec une jolie équipe un service tout simplement orienté… domination SERPs (Search Engine Results Pages pour les incultes).

Pour ceux qui suivent le concours Pandaranol, vous avez pu remarquer que je suis un peu mégalo quand il s’agit d’attaquer une niche (A priori j’occupe 80% des 100 premiers résultats)… et bien à partir d’aujourd’hui, je vous propose vous aussi de dominer votre niche de la même manière. Pas de chichi, les pionniers du web de nos jours n’ont pas un seul nom de domaine, mais des dizaines (voire des centaines…). Cependant, on le sait tous, créer une dizaine de sites web et tous les référencer relève de la mission impossible si on le fait soit-même, et risque de nous coûter un morceau précieux de notre anatomie si l’on passe par une agence. On est bien d’accord ?

I. Mininet.fr : kesako ?

Mininet.fr est un nouveau service basé sur une équipe spécialisée en :
- Création de site internet & Web Design
- Rédaction de contenu
- Référencement
- Stratégies Web Marketing

Les 4 piliers qui mènent au succès sur le Web selon moi.
Le but est simple : vous offrir plus de visibilité, plus de ranking et plus de trafic à travers la mise en place de dizaine de satellites professionnels low-cost !

Mininet.fr est donc un service exclusif, qui vous propose de mettre en place une stratégie de ‘démultiplication’.
Cette dernière passe par la mise en place de dizaine de nouveaux noms de domaines/sites web professionnels, contenus et référencement fournis.

En créant un mininet de satellites, vous obtenez :

- Plus de ranking sur votre site principal
- Plus de visibilité via le positionnement des satellites dans les SERPs sur de nouveaux mots-clefs
- Plus de public, vos satellites seront une nouvelle source de trafic vers votre site principal
- Plus de diversité, car vous utiliserez différents discours marketing via vos satelittes
- Plus de sécurité vis à vis de Google, car vos satellites vous serviront de passerelles de référencement


Mininet.fr, une équipe plutôt polyvalente ! (Photo prise à 15h, donc je faisais ma sieste post-déjeuner…)

Aujourd’hui, il est clair et net que basé toute son affaire sur un seul site web est à la fois périlleux (que ce soit vis à vis de Google Panda aujourd’hui, ou d’un futur algorithme demain) et vous fait passer à coté de nombreux publics. Nous souhaitons tous la même chose, être visible sur un maximum de mots-clefs, cependant, nos noms de domaines ne peuvent en général se placer sur des centaines de mots-clefs de manière efficace. Un nom de domaine est porteur de votre référencement, cependant ce dernier ne peut endosser trop de backlinks, sous peine de finir dans les abysses des SERPs.
C’est pourquoi la stratégie du Mininet est la plus efficace : à travers la mise en place de nouveaux noms de domaines, vous pouvez enfin vous attaquez à une visibilité de plus de 100 mots clefs sans aucun risque. Il y a également d’autres stratégies/concepts dans l’utilisation des satellites, comme celle du monopole par exemple. Le premier résultat d’une page Google obtient environ 35% de clics. Qu’en serait-il si vous occupiez avec vos satellites toute la première page ? 85% des clics…

Cependant, ne nous méprenons pas, l’utilisation de réseaux de sites web n’est pas nouvelle, et est largement utilisée par les géants du Web, possédant 50, 100, 500 noms de domaines, afin d’attirer le plus de public possible.
Le seul soucis : lancer 10 nouveaux sites web et les faire référencer en passant par une agence vous couterait…. je vous laisse faire le calcul. Et en temps ? Je vous laisse également faire le calcul.
Mininet.fr est donc selon moi un service nouveau, un service vous proposant de créer rapidement et à moindre coût vos satellites web. Grâce à une équipe complète, la prestation est clairement orientée référencement, graphisme, contenu et marketing, une combinaison qui aujourd’hui est vitale sur Internet.

II. Mininet.fr : ça à l’air pas mal

Faut que j’arrête avec mes titres de paragraphes qui veulent rien dire, mais bon, il paraît que c’est important pour la lecture ;p.
Bref tout cela pour dire que Mininet.fr est un service en avance sur son temps, et que ceux qui ont bien compris qu’un business sur Internet ne se gère pas avec une vitrine, mais avec un poulpe (ben oui, le poulpe a plein de tentacules), c’est ceux qui gagneront le plus sur le long terme.

Ceux qui me connaissent savent que je suis très exigeant, et cette exigence sera tout simplement une marque de qualité pour vous fournir un service à la fois low-cost et professionnel.
Sachant que pour les niches les plus compétitives et pour les clients les plus richous-richous, Mininet.fr peut fournir des noms de domaines PR3 avec gros blast sur 1 mois, afin d’atteindre les ‘doigts dans le nez’ les premières positions en un temps record (1 mois environ). Magique magique.

D’ailleurs on remarquera que ce service est selon moi un juste équilibre entre « White Hat » et « Black hat » (même si de plus en plus ces termes ne veulent plus rien dire, sachant que le White Hat fait du Black Hat non-automatisé, et que le Black Hat peut très bien fournir du contenu/liens totalement légitimes dans les guidelines Google), et qu’il permet très rapidement d’amplifier son cercle de visibilité avec un risque tout simplement zéro. D’ailleurs, c’est actuellement l’objectif principal vers lequel je tends, puisque le meilleur des Black hats sera celui qui arrive à créer un maximum de Backlinks à forte autorité, au rendu totalement white, n’émettant aucune suspicion, n’enfreignant aucune guideline. Et Mininet.fr est clairement une avancé dans ce sens.

III. En savoir plus

Pour en savoir plus sur Mininet.fr, je vous invite à visiter dans l’ordre suivant ces pages :
- Concept et exemple de Mininet
- Offres Mininet
- Questions & Réponses
- Et si besoin, Live Chat, pour me parler en direct (500 euros l’entrée)

N’hésitez pas à poster en commentaire vos remarques/questions !
Et si vous aimez les dauphins roses, retweeter cet article :) .

]]>
http://www.backlinker.fr/mininet-fr-nouveau-service-de-referencement/feed/ 18
Le Pandaranol Seo World Cup est lancé ! http://www.backlinker.fr/le-pandaranol-seo-world-cup-est-lance/ http://www.backlinker.fr/le-pandaranol-seo-world-cup-est-lance/#comments Mon, 23 May 2011 17:43:21 +0000 Backlinker http://www.backlinker.fr/?p=328 Et oui mes amis, ça y est, le moment tant attendu du Pandaranol est lancé, mot-clef dévoilé à 19h00 ce lundi 23 mai 2011 ! On remarquera que le mot-clef est particulièrement bien choisi ;) .

La course va être folle, de gros référenceurs francophones y participent afin de devenir millionnaire, il y a même une équipe de 13 référenceurs white-hat.

Je participe au concours avec plusieurs noms de domaine, afin de tester au moins 3 techniques de référencement, et jauger de leur efficacité.
Cependant, koolioo.com est mon blog dédié au concours, où je publie des articles d’analyse et de suivi sur le concours Pandaranol.
S’en suivent trois autres noms de domaine :
- koolioo.fr Pandaranol
- koolioo.net Pandaranol
- koolioo.org Pandaranol

]]>
http://www.backlinker.fr/le-pandaranol-seo-world-cup-est-lance/feed/ 25