Ispirazioni Black Hat 1 – Fonti di contenuto

SEO

Dirò una cosa impopolare: ogni vero SEO specialist ha dentro di sè un piccolo seme di male che lo porta ad avere pensieri “black hat”… ci prova sempre a a fare pubbliche relazioni, ad essere un markettaro, un “social media fuffaro” (e a volte gli riesce pure bene) ma i pensieri black hat, per quanto repressi, tornano insistenti e lo ossessionano. :-)

Certo, se glielo chiederete in pubblico vi dirà che “content is king” e che bisogna lavorare pensando prima di tutto al navigatore. “When Google Was not yet Evil” queste affermazioni erano utili per essere ammessi nei “salotti buoni”) ;-)
Poi scoprirete che lo stesso SEO nella sua vita professionale ha collezionato una sfilza di siti spam o “made for adsense”, o addirittura aggretatori che “rubano” e mescolano i contenuti altrui (quest’ultima è l’unica pratica che non ho mai attuato e che ritengo esecrabile, NdR).

Il sogno SEO

Il vero SEO specialist però agisce non tanto (o non solo) per il guadagno, quanto per il gusto di sperimentare: infatti si ritrova in testa una vocina assillante che gli sussura di mettere il suo ingegno al servizio del male più puro e disinteressato. E allora cercherà di capire quel che piace e non piace agli spider e di filtrare tra le pieghe di un algoritmo che cerca ogni giorno di avvicinarsi alle umane capacità di discernimento ma che, proprio per questa sua palese intenzione, è in parte prevedibile.

Uno dei molti sogni ricorrenti di ogni vero SEO è quello di poter attingere a una sorgente infinita di contenuti originali costantemente aggiornati e poterne disporre a piacimento, quello che però molti ancora non considerano è che lo stesso Google ci mette a disposizione strumenti utili a questo scopo, e  il primo e più importante tra questi è Google Translate.

Google Translate (e altre fonti) per creare contenuti originali

Le traduzioni generate da GT sono davvero eccellenti e la loro qualità migliora di mese in mese (al contrario del glorioso Babelfish, oggi marchiato Yahoo), quindi un SEO Specialist accorto oggi ne può fare decisamente buon uso: non staremo qui a descrivere per filo e per segno tutti gli ambiti di applicazione più o meno “black hat” ma ci limiteremo a fornire alcuni indizi.

Partiamo quindi dalla considerazione, per ora ovvia, che un contenuto tradotto in un altra lingua, agli occhi di Google è un contenuto originale: a questo scopo Google Translate può essere utilizzato manualmente oppure attraverso uno script.

I più spregiudicati tra voi ovviamente punteranno alla seconda soluzione, tuttavia Google non è l’ultimo arrivato, le ha pensate tutte e ha ritenuto opportuno inserire alcuni ostacoli e limitazioni.

Limitazioni imposte da Google

  1. Il primo tra questi è l’abbandono, qualche anno fa, della Google SOAP API (Application Programming Interface) utilizzabile server-side, abbandonata a favore delle API Ajax (Javascript/Client quindi). Quindi oggi chi vuole fare request HTTP a Google (sia per la verifica dei ranking che per altri scopi meno facilmente intuibili ma altrettanto ragionevoli)  deve necessariamente passare per Javascript/Ajax (e non otterà quindi dei contenuti indicizzabili dagli spider) oppure violare le linee guida e fare grabbing.
  2. Proprio per mettere i bastoni tra le ruote ai grabbers il codice sorgente di qualsiasi risultato restituito da qualsiasi servizio Google, se richiamato in modo non compatibile con le linee guida, è abbastanza confuso e muta con una certa frequenza (per impedire che l’estrazione di puro testo sia troppo semplice).
  3. In modo particolare è difficile estrarre contenuto utile richiamando via script lato server Google Translate: infatti bisogna prima aggirare un frameset, raggiungere un url che verificherà se la precedente richiesta è passata dal frameset…e così via. Come se non bastasse il codice sorgente comprende la versione nascosta nella lingua originale…il tutto ovviamente mascherato da funzionalità utile per l’utente (come evidenziato nelle immagini 1, 2 e 3)

Insomma, provare per credere… (traduzione automatica di un post di OMB).

Riassumiamo brevemente

API Ajax per evitare di “regalare” contenuti indicizzabili e limitare le richieste dei software di ranking; frameset, codice sporco e contenuto nascosto per limitare l’estrazione di testo utile; modifiche frequenti al sorgente generato per rendere obsolete le procedure di grabbing.

Nella seconda parte di questo lungo intervento, che verrà pubblicata in settimana, vedremo che in realtà esiste anche una REST Google API (poco conosciuta) e come sia possibile utilizzare concretamente Google Translate per ricavarne contenuti utili ai fini SEO.

Per maggiori informazioni sull’abbandono delle SOAP API segnalo anche un mio vecchio articolo sul blog di HTML.it: Abbandonata la SOAP Search API: l’ennesimo “dispetto” ai SEO?


Articolo nelle categorie | SEO

Potrebbero interessarti anche questi articoli correlati:
Pare che questo post sia particolare: non abbiamo trovato articoli correlati.
Salva e condividi questo post: post<li>
Vuoi partecipare? Vota questo articolo!
1 Stella2 Stelle3 Stelle4 Stelle5 Stelle (3 votes, average: 5,00 out of 5)
Loading ... Loading ...

16 Commenti su questo articolo

  1. Petro ha scritto:

    Fabio, quanto è vero ciò che affermi a proposito del rapporto tra SEO e Black Hat! :D

    Avevo pensato anch’io a Google Translate, ma non mi ero mai spinto fino a valutare le possibilità tecniche di scraping… adesso che leggo le tue conclusioni, rinuncio in partenza. (Eventualmente) lo farò a manina :P

    P.s. ma quei plugin per WP che sfruttano il servizio Translate per creare copie tradotte in varie lingue lato server? Li hai mai testati? A giudicare da ciò che vedo nelle SERP, vanno, e pure bene!

  2. pdellov ha scritto:

    Un altro modo, di cui dicustevo tempo fa con un amico, consiste nel tradurre un testo più volte dalla lingua originale in altre lingue, per poi tornare alla lingua originale, apparendo diverso..
    Esempi:

    Italiano-Inglese-Italiano
    Italiano-Inglese-Tedesco-Inglese-Italiano
    ..

    Ovviamente va trovata la migliore soluzione in assoluto che restituisca un testo abbastanza diverso e allo stesso tempo senza troppi errori..

  3. Fabio Sutto ha scritto:

    @petro pur conoscendoti poco ero quasi sicuro che ci fosse un “seme di male” in te ;)

    Comunque lo scraping si può fare con un po’ di espressioni regolari e qualche passaggio di controllo, solo che non è proprio agevole da automatizzare (ci sto lavorando).

    @pedellov non ho mai provato

    italiano > inglese > italiano

    ma essendo le traduzioni molto ben fatte temo che il testo rimarrebbe sostanzialmente molto simile (e al tempo stesso forse molto deteriorato)

    Per quanto riguarda

    Italiano > Inglese > Tedesco > Inglese > Italiano

    Mi sembra eccessivo, io farei semplicemente

    lingua straniera > italiano

  4. Criss ha scritto:

    Quanto è vero, quanto è vero Fabio…ad un certo punto del post ho visto il mio ritratto….
    Qualunque SEO, e ti dirò di più per rafforzare una categoria..qualunque SEO programmatore ha insito in se il gene maligno del black hat…qualcuno si giustifica dicendo che è Gray Hat :)
    Bella l’idea del grabbing, e bella l’idea di pdellov…secondo me si possono unire in un qualche senso le idee per ricreare i testi…però alla fine una sistematina manuale serve sempre. Più che un utilizzo diretto lo vedo bene per un db di testi già pronti e utilizzabili all’esigenza.
    Ciao, chi c’è ci si vede da Madri…o al SEO Birra se Lucio mi manda :)

  5. Fabio Sutto ha scritto:

    @criss

    a Roma ci sono di sicuro, a Milano ancora non so ma qualcuno di OMB ci sarà. Semmai ci si vede per una birra a RN :)

  6. Valentino ha scritto:

    non mi piace la divisione “male/bene”.

    considerando che Google non è un arbitro della moralità altrui, si tratta piuttosto di valutare l’efficacia e soprattutto il rischio di ban di certe operazioni.

    per quanto riguarda la traduzione automatica, capisco come aumenti le visite, ma non dimenticate che diminuisce la qualità dei contenuti, e quindi può rovinare la reputazione di un sito che punta a contenuti di qualità

    non so voi, ma io di solito quando capito su un sito con contenuti tradotti in automatico storco il naso e cambio pagina

  7. pdellov ha scritto:

    Non credo si debba vedere necessariamente tutto il contenuto orientato per l’utente, ad esempio personalmente uso la tecnica delle traduzioni multiple di cui ho parlato nel commento precedente per riempire di contenuti micrositi creati per spingere un sito principale, per i quali sinceramente non mi interessa molto generare traffico.
    Ovvero: in ottica posizionamento attraverso mini siti avere traffico sui mini siti può servire per ottenere links, potenziarli e quindi potenziare i links in uscita, questo però richiederebbe troppo lavoro che, rapportato ai reali benefici, riporta un guadagno molto inferiore a quello di poco lavoro(contenuti generati in auto) rapportato ad un numero di links in entrata minore.
    Anche se, nella più rosea visione, lavorando il più possibile su 10 minisiti aggiungendo ottimi contenuti, i link rispetto a quelli ottenuti scrivendo in automatico fossero 4 volte maggiori il vantaggio non ci sarebbe.

  8. Fabio Sutto ha scritto:

    L’uso più comune di questi contenuti è proprio quello descritto da Pdellov (micrositi tematici).

    Qui si parla di Black Hat SEO…cosa c’entra l’utente? Che si f***a :D

  9. Andrea Serravezza ha scritto:

    @petro: ti riferisci al plugin di nothing2hide e al taragana? funzionano discretamente ma funzionano… :D

    è un altro modo di allungare la coda agli accessi :)

  10. Fabio Sutto ha scritto:

    @petro e @andrea

    mi ero perso il pezzo sui plugin di WP, no…mai testati

  11. pdellov ha scritto:

    In pratica a che servono questi plugins? Illuminatemi :)

    @Fabio: quanto hai tempo rispondi alla mail che ti ho mandato.

  12. Marco ha scritto:

    Purtroppo è vero che è difficile resistere al potere della conoscenza e un SEO che si rispetti ha un bel bagaglio di nozioni sui motori di ricerca. Il guaio è che essendo un essere umano ogni tanto gli viene in mente un’idea geniale per prendere una scorciatoia ed il caso vuole che abbia tutti gli strumenti per metterla in pratica e provarla. Che fare, legarsi alla sedia e resistere? Fatti non foste a viver come bruti …
    So bene cosa significa, è per questo che sono convinto che più noi ne sappiamo sui motori di ricerca e peggiori saranno i loro risultati.

  13. Fabio Sutto ha scritto:

    Ciao Marco,

    tutto vero ovviamente, ma in realtà i risultati dei motori di ricerca sono migliorati nel tempo proprio grazie al “tiro alla fune” con i SEO.

    SEO e Motori si sono splasmati a vicenda in questi anni

  14. Marco Bertoletti ha scritto:

    ottimi suggerimenti
    un suggerimento per essere ben posizionati a livello di SEO per coloro che hanno siti all’interno dei quali sono presenti sponsorizzazioni di eventi, oppure nell’occasione di lancio di un sito che tratti tematiche di interesse e di attualità, una buona soluzione potrebbe essere quella di creare comunicati stampa (da pubblicare sugli appositi siti) per incrementare la link popularity al sito in questione.
    Per chi vuole approfondire l’argomento internet marketing consiglio di visitare questo blog

  15. Nico Guzzi ha scritto:

    grazie a te, valuterò anche queste misure in eventuali progetti SEO-SPAM… ma sul fatto che questi lavori non si facciano poi tanto per provare ad arrotondare con AdSense non sono d’accordo, secondo me molti di quelli che lavorano in questo settore nei ritagli di tempo cercano di monetizzare le proprie conoscenze, niente di male in fondo, certo esiste poi un eventuale problema fiscale se gli ads cominciano ad andare :)

  16. Seo Mad Hat ha scritto:

    Da qualche parte dovrei avre uno script in php che utilizza Google Traslate e mi pare proprio che funziona… Per il testo originale in italiano una pulizia del codice HTML dovrebbe bastare! Rimane comunque un problema, le traduzioni non sono un gran chè, niente siti di qualità con questo sistema! Ma solo siti Black… o al massimo Grey Hat ^_^

Lascia il tuo commento

  • Tags
  • Popolari
  • Consigliati
  • Commentati
  • Iscriviti !
Iscriviti al feed RSS di OnlineMarketingBlog!
News e suggerimenti di Web marketing: iscriviti al feed RSS di Online Marketing Blog per rimanere sempre aggiornato!
Fai pubblicità su OMB

OMB – gli autori

  • Federico Calore si occupa di web marketing e motori di ricerca per passione e professione: è consulente esperto di search engine marketing, web analysis e online advertising.
    Logo Adwords Qualified Professional
  • Fabio Sutto, sviluppatore server-side dal 1998, è passato dalla programmazione ai motori di ricerca, quindi al web marketing e al web 2.0: nell'attesa delle novità che verranno.
  • Chi scrive su OMB? Visita il profilo di tutti gli autori di OMB.

Categorie