Dirò una cosa impopolare: ogni vero SEO specialist ha dentro di sè un piccolo seme di male che lo porta ad avere pensieri “black hat”… ci prova sempre a a fare pubbliche relazioni, ad essere un markettaro, un “social media fuffaro” (e a volte gli riesce pure bene) ma i pensieri black hat, per quanto repressi, tornano insistenti e lo ossessionano.
Certo, se glielo chiederete in pubblico vi dirà che “content is king” e che bisogna lavorare pensando prima di tutto al navigatore. “When Google Was not yet Evil” queste affermazioni erano utili per essere ammessi nei “salotti buoni”) ![]()
Poi scoprirete che lo stesso SEO nella sua vita professionale ha collezionato una sfilza di siti spam o “made for adsense”, o addirittura aggretatori che “rubano” e mescolano i contenuti altrui (quest’ultima è l’unica pratica che non ho mai attuato e che ritengo esecrabile, NdR).
Il sogno SEO
Il vero SEO specialist però agisce non tanto (o non solo) per il guadagno, quanto per il gusto di sperimentare: infatti si ritrova in testa una vocina assillante che gli sussura di mettere il suo ingegno al servizio del male più puro e disinteressato. E allora cercherà di capire quel che piace e non piace agli spider e di filtrare tra le pieghe di un algoritmo che cerca ogni giorno di avvicinarsi alle umane capacità di discernimento ma che, proprio per questa sua palese intenzione, è in parte prevedibile.
Uno dei molti sogni ricorrenti di ogni vero SEO è quello di poter attingere a una sorgente infinita di contenuti originali costantemente aggiornati e poterne disporre a piacimento, quello che però molti ancora non considerano è che lo stesso Google ci mette a disposizione strumenti utili a questo scopo, e il primo e più importante tra questi è Google Translate.
Google Translate (e altre fonti) per creare contenuti originali
Le traduzioni generate da GT sono davvero eccellenti e la loro qualità migliora di mese in mese (al contrario del glorioso Babelfish, oggi marchiato Yahoo), quindi un SEO Specialist accorto oggi ne può fare decisamente buon uso: non staremo qui a descrivere per filo e per segno tutti gli ambiti di applicazione più o meno “black hat” ma ci limiteremo a fornire alcuni indizi.
Partiamo quindi dalla considerazione, per ora ovvia, che un contenuto tradotto in un altra lingua, agli occhi di Google è un contenuto originale: a questo scopo Google Translate può essere utilizzato manualmente oppure attraverso uno script.
I più spregiudicati tra voi ovviamente punteranno alla seconda soluzione, tuttavia Google non è l’ultimo arrivato, le ha pensate tutte e ha ritenuto opportuno inserire alcuni ostacoli e limitazioni.
Limitazioni imposte da Google
- Il primo tra questi è l’abbandono, qualche anno fa, della Google SOAP API (Application Programming Interface) utilizzabile server-side, abbandonata a favore delle API Ajax (Javascript/Client quindi). Quindi oggi chi vuole fare request HTTP a Google (sia per la verifica dei ranking che per altri scopi meno facilmente intuibili ma altrettanto ragionevoli) deve necessariamente passare per Javascript/Ajax (e non otterà quindi dei contenuti indicizzabili dagli spider) oppure violare le linee guida e fare grabbing.
- Proprio per mettere i bastoni tra le ruote ai grabbers il codice sorgente di qualsiasi risultato restituito da qualsiasi servizio Google, se richiamato in modo non compatibile con le linee guida, è abbastanza confuso e muta con una certa frequenza (per impedire che l’estrazione di puro testo sia troppo semplice).
- In modo particolare è difficile estrarre contenuto utile richiamando via script lato server Google Translate: infatti bisogna prima aggirare un frameset, raggiungere un url che verificherà se la precedente richiesta è passata dal frameset…e così via. Come se non bastasse il codice sorgente comprende la versione nascosta nella lingua originale…il tutto ovviamente mascherato da funzionalità utile per l’utente (come evidenziato nelle immagini 1, 2 e 3)
Insomma, provare per credere… (traduzione automatica di un post di OMB).
- IMG 1: Frameset da “aggirare”
- IMG 2: testo nascosto non tradotto
- IMG 3: Codice sorgente
Riassumiamo brevemente
API Ajax per evitare di “regalare” contenuti indicizzabili e limitare le richieste dei software di ranking; frameset, codice sporco e contenuto nascosto per limitare l’estrazione di testo utile; modifiche frequenti al sorgente generato per rendere obsolete le procedure di grabbing.
Nella seconda parte di questo lungo intervento, che verrà pubblicata in settimana, vedremo che in realtà esiste anche una REST Google API (poco conosciuta) e come sia possibile utilizzare concretamente Google Translate per ricavarne contenuti utili ai fini SEO.
Per maggiori informazioni sull’abbandono delle SOAP API segnalo anche un mio vecchio articolo sul blog di HTML.it: Abbandonata la SOAP Search API: l’ennesimo “dispetto” ai SEO?








maggio 11th, 2009 alle 12:42
Fabio, quanto è vero ciò che affermi a proposito del rapporto tra SEO e Black Hat!
Avevo pensato anch’io a Google Translate, ma non mi ero mai spinto fino a valutare le possibilità tecniche di scraping… adesso che leggo le tue conclusioni, rinuncio in partenza. (Eventualmente) lo farò a manina
P.s. ma quei plugin per WP che sfruttano il servizio Translate per creare copie tradotte in varie lingue lato server? Li hai mai testati? A giudicare da ciò che vedo nelle SERP, vanno, e pure bene!
maggio 11th, 2009 alle 14:05
Un altro modo, di cui dicustevo tempo fa con un amico, consiste nel tradurre un testo più volte dalla lingua originale in altre lingue, per poi tornare alla lingua originale, apparendo diverso..
Esempi:
Italiano-Inglese-Italiano
Italiano-Inglese-Tedesco-Inglese-Italiano
..
Ovviamente va trovata la migliore soluzione in assoluto che restituisca un testo abbastanza diverso e allo stesso tempo senza troppi errori..
maggio 11th, 2009 alle 14:32
@petro pur conoscendoti poco ero quasi sicuro che ci fosse un “seme di male” in te
Comunque lo scraping si può fare con un po’ di espressioni regolari e qualche passaggio di controllo, solo che non è proprio agevole da automatizzare (ci sto lavorando).
@pedellov non ho mai provato
italiano > inglese > italiano
ma essendo le traduzioni molto ben fatte temo che il testo rimarrebbe sostanzialmente molto simile (e al tempo stesso forse molto deteriorato)
Per quanto riguarda
Italiano > Inglese > Tedesco > Inglese > Italiano
Mi sembra eccessivo, io farei semplicemente
lingua straniera > italiano
maggio 11th, 2009 alle 14:58
Quanto è vero, quanto è vero Fabio…ad un certo punto del post ho visto il mio ritratto….
Qualunque SEO, e ti dirò di più per rafforzare una categoria..qualunque SEO programmatore ha insito in se il gene maligno del black hat…qualcuno si giustifica dicendo che è Gray Hat
Bella l’idea del grabbing, e bella l’idea di pdellov…secondo me si possono unire in un qualche senso le idee per ricreare i testi…però alla fine una sistematina manuale serve sempre. Più che un utilizzo diretto lo vedo bene per un db di testi già pronti e utilizzabili all’esigenza.
Ciao, chi c’è ci si vede da Madri…o al SEO Birra se Lucio mi manda
maggio 11th, 2009 alle 15:13
@criss
a Roma ci sono di sicuro, a Milano ancora non so ma qualcuno di OMB ci sarà. Semmai ci si vede per una birra a RN
maggio 11th, 2009 alle 15:25
non mi piace la divisione “male/bene”.
considerando che Google non è un arbitro della moralità altrui, si tratta piuttosto di valutare l’efficacia e soprattutto il rischio di ban di certe operazioni.
per quanto riguarda la traduzione automatica, capisco come aumenti le visite, ma non dimenticate che diminuisce la qualità dei contenuti, e quindi può rovinare la reputazione di un sito che punta a contenuti di qualità
non so voi, ma io di solito quando capito su un sito con contenuti tradotti in automatico storco il naso e cambio pagina
maggio 11th, 2009 alle 15:46
Non credo si debba vedere necessariamente tutto il contenuto orientato per l’utente, ad esempio personalmente uso la tecnica delle traduzioni multiple di cui ho parlato nel commento precedente per riempire di contenuti micrositi creati per spingere un sito principale, per i quali sinceramente non mi interessa molto generare traffico.
Ovvero: in ottica posizionamento attraverso mini siti avere traffico sui mini siti può servire per ottenere links, potenziarli e quindi potenziare i links in uscita, questo però richiederebbe troppo lavoro che, rapportato ai reali benefici, riporta un guadagno molto inferiore a quello di poco lavoro(contenuti generati in auto) rapportato ad un numero di links in entrata minore.
Anche se, nella più rosea visione, lavorando il più possibile su 10 minisiti aggiungendo ottimi contenuti, i link rispetto a quelli ottenuti scrivendo in automatico fossero 4 volte maggiori il vantaggio non ci sarebbe.
maggio 11th, 2009 alle 16:12
L’uso più comune di questi contenuti è proprio quello descritto da Pdellov (micrositi tematici).
Qui si parla di Black Hat SEO…cosa c’entra l’utente? Che si f***a
maggio 11th, 2009 alle 16:26
@petro: ti riferisci al plugin di nothing2hide e al taragana? funzionano discretamente ma funzionano…
è un altro modo di allungare la coda agli accessi
maggio 11th, 2009 alle 16:28
@petro e @andrea
mi ero perso il pezzo sui plugin di WP, no…mai testati
maggio 13th, 2009 alle 20:10
In pratica a che servono questi plugins? Illuminatemi
@Fabio: quanto hai tempo rispondi alla mail che ti ho mandato.
maggio 29th, 2009 alle 19:44
Purtroppo è vero che è difficile resistere al potere della conoscenza e un SEO che si rispetti ha un bel bagaglio di nozioni sui motori di ricerca. Il guaio è che essendo un essere umano ogni tanto gli viene in mente un’idea geniale per prendere una scorciatoia ed il caso vuole che abbia tutti gli strumenti per metterla in pratica e provarla. Che fare, legarsi alla sedia e resistere? Fatti non foste a viver come bruti …
So bene cosa significa, è per questo che sono convinto che più noi ne sappiamo sui motori di ricerca e peggiori saranno i loro risultati.
maggio 29th, 2009 alle 19:50
Ciao Marco,
tutto vero ovviamente, ma in realtà i risultati dei motori di ricerca sono migliorati nel tempo proprio grazie al “tiro alla fune” con i SEO.
SEO e Motori si sono splasmati a vicenda in questi anni
giugno 4th, 2009 alle 13:02
ottimi suggerimenti
un suggerimento per essere ben posizionati a livello di SEO per coloro che hanno siti all’interno dei quali sono presenti sponsorizzazioni di eventi, oppure nell’occasione di lancio di un sito che tratti tematiche di interesse e di attualità, una buona soluzione potrebbe essere quella di creare comunicati stampa (da pubblicare sugli appositi siti) per incrementare la link popularity al sito in questione.
Per chi vuole approfondire l’argomento internet marketing consiglio di visitare questo blog
giugno 30th, 2009 alle 15:38
grazie a te, valuterò anche queste misure in eventuali progetti SEO-SPAM… ma sul fatto che questi lavori non si facciano poi tanto per provare ad arrotondare con AdSense non sono d’accordo, secondo me molti di quelli che lavorano in questo settore nei ritagli di tempo cercano di monetizzare le proprie conoscenze, niente di male in fondo, certo esiste poi un eventuale problema fiscale se gli ads cominciano ad andare
marzo 27th, 2010 alle 21:40
Da qualche parte dovrei avre uno script in php che utilizza Google Traslate e mi pare proprio che funziona… Per il testo originale in italiano una pulizia del codice HTML dovrebbe bastare! Rimane comunque un problema, le traduzioni non sono un gran chè, niente siti di qualità con questo sistema! Ma solo siti Black… o al massimo Grey Hat ^_^