
Cela fait quelques semaines que l'on se creuse la tête avec Ipiky et Seymour pour créer notre propre outils de création automatique de mfa. Biensûr on ne compte pas détrôner Link Farm Evolution ou SEnuke mais on souhaite avoir notre propre logiciel de scrap-spin-cloak-autoblog-makemoney software.
En résumé nous cherchons à faire un petit soft pour scraper du contenu sur le web à l'aide des Xpath, le content spinner, afficher le résultat aux moteurs avec du cloaking et garder l'original pour les visiteurs humains et publier automatiquement tout ça sur une ferme d'une vingtaine de splog générés à la volée (pas tous monétisés).
On s'attendait à rencontrer quelques difficultés mais là, on bloque. Du coup on met le projet de coté pendant quelques temps pour s'aérer l'esprit.
Pour l'instant nous avons déjà cela de fait :
- On utilise yahoo Pipes pour unir les différentes sources RSS des sites que l'on souhaite aspirer. A partir de ces flux on sort les liens vers les articles complets (merci à discodog pour ses astuces sur yahoo pipes)
- Les liens donnés par le flux sortant de yahoo pipes sont aspirés, transformer en fichiers html en local. On vérifie que les liens des images et/ou vidéos sont en absolus (pour éviter les erreurs de chemin à l'affichage sur les splogs) sinon on ajoute la source à l'adresse. On extrait ce qui nous interesse (pour l'instant à l'aide de regex mais on se penche sur la solution du Xpath plus pertient selon nous. On a également essayer avec Imacros sans grand succès...) et on stock le tout en base.
- On spinn le contenu avec un thesaurus Fr et En éditer par nos soin (sur la base du fichier partagé par Seoblackout largement adapté par nos soins et d'un autre logiciel de spin qu'on aime assez ici) en prenant soin de ne pas modifier les médias du contenu.
- On stocke les différentes versions résultats ( 1 version par splog avec au minimum de 60% de contenu unique ). On programme des dates de publication sur plusieurs mois (on réfléchit sur ce point. J'ai lu que l'ajout de backlink rapidement vers un site simule le buzz pour notre ami monsieur G et fait gagner des places dans les serp plus rapidement mais j'attend le retour à long terme avant de me prononcer. - Ndlr: pas moyen de me souvenir où j'ai lu ça... seosphere peut etre...). Idéalement on publiera l'article original pour les humains et le synonymisé pour les moteurs avec du cloaking (très hasardeux pour le moment)
- On paramètre les adresses, login et password de nos blogs (pour l'instant créés à la mano) et on autopost nos billets.
Reste donc beaucoup de travail pour exploiter pleinement le scrap qui cafouille un peu et encore plus pour le post automatique (de gros problème de doublons et de cloak avec les robots) mais on va s'y remettre bientôt.
Partager cet article
| < Précédent | Suivant > |
|---|





Commentaires
En effet on entend beaucoup parler des fermes de contenu qui évolue avec les requêtes en ce moment (surtout depuis que Google a annoncé leur faire la chasse) et c'est vrai qu'on ne s'est pas lancé dans un projet d'une telle envergure.
Deux raisons à ça : on préfère cibler nous même ce que l'on diffuse et deuxièmement a nous 3 on a pas les connaissances pour réaliser cela. Mais si tu veux partager tes pistes on est ouvert !
Avec Beunwa on a fait un cms similaire qu'on compte sortir un jour en publique, mais hyper difficile à contrôler dans le temps.
1 mois plus tard tu fais 10 ou 20k de vu/jours mais 6 mois plus tard tu te fais shooter.
Bon courage! ;)
C'est un peu pour celà que le projet et de côté pour l'instant. Le but était d'avoir des sites tampons pour générer du jus a balancer ailleurs.
Sinon, c'est ce genre de site auto qui doit servir de tampon et surtout pas de moneysite.
On a mis pas mal le SEO de côté en moment pour s'adonner à l'apprentissage du web marketing avec pour objectif moins de site, plus de conversion et des sites plus "propres".
Le soucis est de savoir comment partager son expérience sans en dire trop. J'ai pas mal appris grâce à blackmelvin aussi, qui selon moi en dit trop.
pas de nouvelles du projet ?