
Come SEO non sono mai stato un maniaco della velocità di risposta del server, ma da qualche tempo sono molto più fiscale nei confronti delle piattaforme utilizzate per lo sviluppo WEB.
Infatti credo di non essere l’unico ad aver notato ultimamente una certa “pigrizia” da parte dello spider di Google, il quale tende a passare con minore frequenza e senza scendere troppo in profondità nei livelli di navigazione. Come se non bastasse anche la cache viene aggiornata meno assiduamente.
Oggi è più che mai evidente che l’enorme quantità di informazioni presenti in rete (un blob vischioso e in continua crescita), richiede ai motori di ricerca di dosare le proprie forze e premiare i siti virtuosi dal punto di vista delle performance. Se le cose stanno così non possiamo permetterci di sottovalutare i tempi di caricamento delle pagine, per lo meno da quando il fattore “aggiornamento dei contenuti” è così importante agli occhi di Google.
Purtroppo anche quando ci troviamo in presenza della migliore infrastruttura lato server non c’è nulla da fare se lo sviluppatore ci mette lo zampino: CMS evoluti come Typo3 ed Ez Publish (ma anche Mambo/Joomla che così evoluti non sono), o framework puri come Zend, Django, Ruby On Rails possono mettere a dura prova le risorse hardware e di conseguenza i tempi di risposta delle pagine WEB. Non parliamo poi dei framework “fatti in casa” e pensati per agevolare lo sviluppatore più che il navigatore.
Ecco dunque alcune linee guida salva spider (e, alla lunga, salva SERP)
La regola base
è quella di non scrivere il codice come se le risorse lato server fossero illimitate: controlliamo in modo particolare il numero di query al database che ogni pagina determina, eliminiamo il più possibile connessioni e query ridondanti.
Caching, caching, caching
quando il traffico è molto intenso, e se il nostro sito si trova spesso nella fortunata situazione di vedere numerosi utenti online contemporaneamente, anche il miglior hardware e il web developer più attento possono fallire. E’ il momento di ottimizzare le risorse evitando di ripetere ad ogni richiesta HTTP le operazioni ricorrenti più dispendiose: perchè ricaricare completamente una pagina se il contenuto non è cambiato rispetto all’ultima volta che è stata visitata?
Possiamo applicare il caching in 3 modi (complementari più che alternativi)
- Query caching: spesso integrato nei principali RDBMS consente di non eseguire ad ogni richiesta HTTP le query più dispendiose.
- Caching del bytecode (o compilazione vera e propria): evita all’interprete (PHP, Python, .NET…) il parsing ripetuto dei sorgenti degli script lato server che non hanno subito modifiche.
- Caching HTML: l’applicazione salva l’output HTML per un certo periodo di tempo, senza eseguire ogni volta tutte le procedure lato server
- Caching lato client: la nostra applicazione dice al browser di utilizzare la propria cache e non completare la request
- Proxy caching: un servizio che si interpone tra il sito e i navigatori, creando una cache condivisa (soluzione che può tra l’altro rivelarsi utile anche per differenziare l’ip tra siti diversi presenti nello stesso server ) .
Ognuno di questi accorgimenti meriterebbe uno specifico intervento di approfondimento, per ora limitiamoci a dire che la presa di coscienza dell’esistenza del problema, e la consapevolezza delle possibili soluzioni, sono già un passo nella giusta direzione da parte di SEO e sviluppatori. A chi infatti non è capitato di vedere lo spider di Google “impallare” un server durante il crawling di un sito dinamico costituito da migliaia di pagine? Tutte le soluzioni appena descritte ci aiutano ad evitare proprio situazioni di questo tipo.
Concludo citando, a beneficio dei più scettici, un recente intervento su Seo Round Table, che dovrebbe togliere ogni tentazione di sottovalutare la questione
Poichè l’argomento mi coinvolge in modo particolare, mi rendo disponibile a fornire ogni chiarimento sulle soluzioni applicabili, quindi per qualsiasi ulteriore informazione scrivetemi pure





maggio 14th, 2008 alle 22:46
Ma vuoi vedere che è successo proprio a me? Due giorni di sito al rallentatore a causa di un bug e calo drastico nelle SERP.
Quanto ci vorrà a recuperare?
maggio 15th, 2008 alle 7:34
Ciao Serena,
dando per scontato che il calo sia dovuto a un’indisponibilità del sito (in realtà in questo periodo le cause sono difficili da individuare con certezza), una volta risolto il problema recupererai molto velocemente
settembre 3rd, 2009 alle 12:38
ciao, sarei interessato ad avere maggiori informazioni (se puoi ovviamente) sul
- Caching del bytecode (php)
- Caching HTML
- Caching lato client
in particolare come poterlo verificare durante la scelta di un hosting piuttosto che un altro. Per quando riguarda come attivarlo e come sfruttarlo al meglio spero di trovare qualcosa in rete eheh
Articolo molto interessante!
ciao
settembre 5th, 2009 alle 12:13
Ciao Nickel,
ognuno degli argomenti richiederebbe almeno un articolo per essere approfondito, quindi i commenti non sono il luogo migliore per parlarne. Puoi cercare maggiori informazioni su google oppure contattarmi in privato all’indirizzo presente nel mio profilo
http://www.online-marketing.it/profilo-fabio-sutto/
Contattami anche se ti serve un consiglio su un hosting affidabile e “SEO Friendly”