WebSite X5Help Center

 
Serzio ©
Serzio ©
User

Mantenere l'indicizzazione nel passaggio da evo8 a evo9  it

Autore: Serzio ©
Visite 6067, Followers 7, Condiviso 0  

Un argomento che raramente è stato trattato, ma a cui nell'ultimo anno sono stati fatti moltissimi riferimenti, riguarda la conversione di un sito web realizzato con website 8 alla release 9. Il testo integrale, ma sostanzialmente identico nei contenuti anche se in forma diversa per evidenti ragioni di indicizzazione, è tratto da un mio topic tutt'ora aperto su http://www.unofficialwsx5.com/index.php?topic=977.0 in cui è ancora possibile discutere la questione.

Una delle prime cose da considerare è che i nomi delle pagine vengono definiti seguendo nuove regole. Gli eventuali spazi presenti ed inseriti nel menu vengono adesso convertiti in "-" piuttosto che in "_" come nella versione 8. In altri termini se in precedenza una pagina relativa alla voce "Pagina 1" nel menu corrispondeva ad un file "pagina_1.html", con la versione 9 corrisponde a "pagina-1.html". E' inutile spiegare il motivo di questa scelta obbligata, ma giustificata, pertanto non ci resta che tenerne conto se decidiamo di operare una "migrazione" del vecchio sito alla nuova versione di website.
Questa apparentemente insignificante modifica ha alcune importanti implicazioni. Con l'esportazione delle pagine realizzate con la nuova versione:

  1. le pagine del sito esportato con la precedente versione, e quindi con la vecchia nomenclatura, non verranno cancellate
  2. i motori di ricerca continueranno a mantenere nei loro database l'indicizzazione delle vecchie pagine
  3. le pagine con la nuova nomenclatura, ma con i vecchi contenuti e che affiancheranno le stesse pagine con la vecchia nomenclatura, dovranno reiniziare da zero la scalata delle serp vanificando gran parte del lavoro svolto per migliorare l'indicizzazione e lasciando un gran caos nei link già indicizzati causando la perdita delle posizioni raggiunte

Per mostrare in dettaglio l'intera operazione, ho eseguito tutto il procedimento su un sito di test che avevo sul pc in locale e riporto le varie operazioni in ordine a partire dal progetto realizzato con la rel 8 fino alla sua esportazione con la rel 9:

Per prima cosa, con website 8, ho eseguito un raggruppamento del sito web in una cartella ed un backup per archiviare il sito funzionante da riutilizzare in caso di problemi. Successivamente ho iniziato il processo di conversione e riporto le immagini con quasi tutti i passaggi, abbastanza obbligati.

A questo punto abbiamo completato la conversione del progetto ed iniziamo a capire come effettuare una esportazione "sicura" che non pregiudichi la situazione attuale del nostro sito web.

Volevo far notare le differenza tra la situazione del sito web esportato con la versione 8, lo stesso sito web se venisse esportato direttamente con la rel 9, ma dopo averlo svuotato dei precedenti contenuti e cosa, invece, accade esportando con la rel 9 direttamente senza aver preventivamente cancellato il vecchio contenuto.

Da sottolineare che la procedura corretta è una delle seguenti:

  1. non cancellare il precedente contenuto e quindi il sito esportato correttamente è quello della terza figura
  2. cancellare il vecchio contenuto ed esportare con la 9 (seconda figura) ma in questo caso è necessario fare in modo che le vecchie pagine non generino errori 404 (pagina non trovata) e successivamente spiegherò come

Nelle seguenti figure riporto tre diverse situazioni successive ad una esportazione delllo stesso sito web.

Sito già esistente esportato con la rel 8:

Come sarebbe lo stesso sito esportato con la versione 9 dopo averlo svuotato dei vecchi contenuti (occorre eseguire le note sull'inserimento a mano delle pagine con la vecchia nomenclatura):

Come dovrebbe essere lo stesso sito web esportato correttamente con la versione 9, ma senza aver tolto i vecchi contenuti:

Se decidiamo di utilizzare il primo dei due metodi, avremo la situazione illustrata della terza figura in cui dobbiamo notare alcune cose:

  1. l'eventuale impostazione relativa alla preparazione del file sitemap.xml non viene rispettata e quindi viene generato il file anche se esplicitamente non desiderato
  2. il vecchio contenuto non viene rimosso, ma lasciato insieme al nuovo
  3. il sito web conterrà pagine che utilizzeranno charset diversi (due figure seguenti)

La questione della generazione non richiesta della sitemap è abbastanza irrilevante, ma è bene saperlo in quanto potrebbe comparire al suo interno il nome di qualche pagina che si vorrebbe tenere nascosta e, se pure non accessibile, potrebbe essere desiderabile che non si sapesse della sua esistenza.

Il vecchio contenuto non può essere rimosso senza aver preso delle precauzioni tali da salvaguardare l'eventuale indicizzazione delle vecchie pagine ed, eventualmente, tramandarla alle nuove.

L'aspetto dei diversi charset è da tenere a mente se vengono usati sistemi di inclusione di pagine in altre con vari metodi e quindi occorre fare attenzione ai caratteri che avranno codifiche differenti con la relativa visualizzazione di simboli strani in corrispondenza di lettere accentate, euro ed altro. Stesso discorso per i blog che vengono trasferiti dal vecchio al nuovo.

Se invece decidiamo di utilizzare il secondo metodo, quello da me consigliato, ci troviamo nella situazione illustrata nella seconda figura ed avremo solo due considerazioni da fare:

  1. il sito web sarà più pulito, non contenendo i vecchi elementi che potrebbero anche crearci qualche piccolo problema, oltre ad occupare spazio sul server
  2. dovremo, probabilmente, creare a mano dei nuovi file di testo da riempire con il codice che riporterò successivamente e che dovranno avere lo stesso nome delle pagine preesistenti che avremo cancellato, ma di cui dovremo aver preso nota (evitabile solo se si utilizza un hosting linux mediante l'uso del file .htaccess)

Per concludere la parte che io definisco "tecnica" dell'operazione (l'altra è costituita dalla verifica di contenuti, impaginazione etc etc), è necessario trovare il sistema per trasferire le eventuali indicizzazioni dalle vecchie pagine alle nuove. Il metodo è quello di utilizzare il cosiddetto Redirect 301 di cui ho parlato su http://www.unofficialwsx5.com/index.php?topic=288.0

Per farla breve, si dovrà dire che tutte le pagine con il vecchio nome dovranno essere sostituite dalle corrispondenti con il nome nuovo, da cui la necessità di disporre anche delle pagine con il vecchio nome.

Riporto un esempio con una delle pagine presenti "polpette_di_stronzio.html" che deve diventare "polpette-di-stronzio.html" e per farlo ci dobbiamo armare di un client ftp e di un editor di testo per fare qualche modifica direttamente sul sito web. Si tratta di modifiche che non verranno annullate con le eventuali successive esportazioni del sito in quanto operate o sul .htaccess (non gestito da website) oppure sulle vecchie pagine del sito (anch'esse non più gestite da website).

Metodo del .htaccess (utilizzabile solo su piattaforma linux)


Per ogni file del vecchio sito si inserisce una riga nel .htaccess come segue (attenzione in locale non sarà possibile inserire il puntino davanti al nome del file e dovrà essere aggiunto solo dopo averlo trasferito sul web)

Metodo del refresh (utilizzabile sia su piattaforma linux che windows)


In ogni file html (o php) del vecchio sito si inserisce una riga come la seguente con il nome della nuova pagina

oppure, se si tratta di una pagina php, si svuota l'intera pagina e si inserisce:

oppure, se si tratta di una pagina html, si svuota l'intera pagina e si inserisce quanto segue:

Questa operazione deve essere eseguita per tutte le pagine che si desidera redirigere.

A questo punto il lavoro è terminato ed occorrerà aspettare che le pagine indicizzate, ad esempio:

vengano sostituite con i nuovi link e per verificarne il buon funzionamento possiamo cliccare sui link elencati per controllare se il browser viene correttamente rediretto verso le nuove pagine, come mostrato. 

Al link evidenziato con la freccia dovrà corrispondere la pagina

e quindi tutti i link attualmente alle pagine vecchie, in un tempo variabile, verranno modificati con i nuovi nomi.

Solo a questo punto, dopo la verifica dell'avvenuta sostituzione, sarà possibile cancellare manualmente con un client ftp tutte le vecchie pagine ancora presenti sul sito web e non più in uso, oppure il relativo contenuto nel file .htaccess che può eventualmente continuare ad esistere anche se completamente vuoto. 

http://www.unofficialwsx5.com

Postato il
2 RISPOSTE
Alessandro M.
Alessandro M.
User

buongiorno,

ho una domanda seguendo il metodo del .htaccess vanno mantenute le vecchie pagine (es. polpette_di_stronzio) sul server ?

grazie

Leggi di più
Postato il da Alessandro M.
Serzio ©
Serzio ©
User
Autore

Con il .htaccess possono essere cancellate le vecchie pagine

 senza alcun problema.

Leggi di più
Postato il da Serzio ©