Tag Archive | "google translate"

Ispirazioni Black Hat 1 – Fonti di contenuto

Tags: , , , , , , ,

Ispirazioni Black Hat 1 – Fonti di contenuto


SEO

Dirò una cosa impopolare: ogni vero SEO specialist ha dentro di sè un piccolo seme di male che lo porta ad avere pensieri “black hat”… ci prova sempre a a fare pubbliche relazioni, ad essere un markettaro, un “social media fuffaro” (e a volte gli riesce pure bene) ma i pensieri black hat, per quanto repressi, tornano insistenti e lo ossessionano. :-)

Certo, se glielo chiederete in pubblico vi dirà che “content is king” e che bisogna lavorare pensando prima di tutto al navigatore. “When Google Was not yet Evil” queste affermazioni erano utili per essere ammessi nei “salotti buoni”) ;-)
Poi scoprirete che lo stesso SEO nella sua vita professionale ha collezionato una sfilza di siti spam o “made for adsense”, o addirittura aggretatori che “rubano” e mescolano i contenuti altrui (quest’ultima è l’unica pratica che non ho mai attuato e che ritengo esecrabile, NdR).

Il sogno SEO

Il vero SEO specialist però agisce non tanto (o non solo) per il guadagno, quanto per il gusto di sperimentare: infatti si ritrova in testa una vocina assillante che gli sussura di mettere il suo ingegno al servizio del male più puro e disinteressato. E allora cercherà di capire quel che piace e non piace agli spider e di filtrare tra le pieghe di un algoritmo che cerca ogni giorno di avvicinarsi alle umane capacità di discernimento ma che, proprio per questa sua palese intenzione, è in parte prevedibile.

Uno dei molti sogni ricorrenti di ogni vero SEO è quello di poter attingere a una sorgente infinita di contenuti originali costantemente aggiornati e poterne disporre a piacimento, quello che però molti ancora non considerano è che lo stesso Google ci mette a disposizione strumenti utili a questo scopo, e  il primo e più importante tra questi è Google Translate.

Google Translate (e altre fonti) per creare contenuti originali

Le traduzioni generate da GT sono davvero eccellenti e la loro qualità migliora di mese in mese (al contrario del glorioso Babelfish, oggi marchiato Yahoo), quindi un SEO Specialist accorto oggi ne può fare decisamente buon uso: non staremo qui a descrivere per filo e per segno tutti gli ambiti di applicazione più o meno “black hat” ma ci limiteremo a fornire alcuni indizi.

Partiamo quindi dalla considerazione, per ora ovvia, che un contenuto tradotto in un altra lingua, agli occhi di Google è un contenuto originale: a questo scopo Google Translate può essere utilizzato manualmente oppure attraverso uno script.

I più spregiudicati tra voi ovviamente punteranno alla seconda soluzione, tuttavia Google non è l’ultimo arrivato, le ha pensate tutte e ha ritenuto opportuno inserire alcuni ostacoli e limitazioni.

Limitazioni imposte da Google

  1. Il primo tra questi è l’abbandono, qualche anno fa, della Google SOAP API (Application Programming Interface) utilizzabile server-side, abbandonata a favore delle API Ajax (Javascript/Client quindi). Quindi oggi chi vuole fare request HTTP a Google (sia per la verifica dei ranking che per altri scopi meno facilmente intuibili ma altrettanto ragionevoli)  deve necessariamente passare per Javascript/Ajax (e non otterà quindi dei contenuti indicizzabili dagli spider) oppure violare le linee guida e fare grabbing.
  2. Proprio per mettere i bastoni tra le ruote ai grabbers il codice sorgente di qualsiasi risultato restituito da qualsiasi servizio Google, se richiamato in modo non compatibile con le linee guida, è abbastanza confuso e muta con una certa frequenza (per impedire che l’estrazione di puro testo sia troppo semplice).
  3. In modo particolare è difficile estrarre contenuto utile richiamando via script lato server Google Translate: infatti bisogna prima aggirare un frameset, raggiungere un url che verificherà se la precedente richiesta è passata dal frameset…e così via. Come se non bastasse il codice sorgente comprende la versione nascosta nella lingua originale…il tutto ovviamente mascherato da funzionalità utile per l’utente (come evidenziato nelle immagini 1, 2 e 3)

Insomma, provare per credere… (traduzione automatica di un post di OMB).

Riassumiamo brevemente

API Ajax per evitare di “regalare” contenuti indicizzabili e limitare le richieste dei software di ranking; frameset, codice sporco e contenuto nascosto per limitare l’estrazione di testo utile; modifiche frequenti al sorgente generato per rendere obsolete le procedure di grabbing.

Nella seconda parte di questo lungo intervento, che verrà pubblicata in settimana, vedremo che in realtà esiste anche una REST Google API (poco conosciuta) e come sia possibile utilizzare concretamente Google Translate per ricavarne contenuti utili ai fini SEO.

Per maggiori informazioni sull’abbandono delle SOAP API segnalo anche un mio vecchio articolo sul blog di HTML.it: Abbandonata la SOAP Search API: l’ennesimo “dispetto” ai SEO?

Posted in SEOComments (16)

  • Tags
  • Popolari
  • Consigliati
  • Commentati
  • Iscriviti !
Iscriviti al feed RSS di OnlineMarketingBlog!
News e suggerimenti di Web marketing: iscriviti al feed RSS di Online Marketing Blog per rimanere sempre aggiornato!
Fai pubblicità su OMB

OMB – gli autori

  • Federico Calore si occupa di web marketing e motori di ricerca per passione e professione: è consulente esperto di search engine marketing, web analysis e online advertising.
    Logo Adwords Qualified Professional
  • Fabio Sutto, sviluppatore server-side dal 1998, è passato dalla programmazione ai motori di ricerca, quindi al web marketing e al web 2.0: nell'attesa delle novità che verranno.
  • Chi scrive su OMB? Visita il profilo di tutti gli autori di OMB.

Categorie