Pagina duplicata senza url canonico selezionato dall'utente
Autor: Luciano F.Ciao ragazzi, ho un curiosità in riferimento all'oggetto e vorrei capirne di più.
Premesso che in un sito Google segnala che la pagina "https://www.xxxxxxxx.it/index.html risulta "Pagina duplicata senza URL canonico selezionato dall'utente".
Se provo a scansionare il sito con "Screaming Frog SEO Spider" ottengo la stessa indicazione ma in più mi dice che "l'altra pagina" è "https://www.xxxxxxxx.it/" che è un duplicato esatto e che ha lo stesso Hash.
Nel mio caso nella radice dell'hosting esiste solo la pagina "index.html" e website genera solo questa.
Ho capito che la situazione si potrebbe risolvere con il tag canonical ma mi chiedo dove sta l'altra pagina "https://www.xxxxxxxx.it/" e perchè io ne vedo solo una mentre sia Google che Screaming Frog ne vedono due?.
Altre prove fatte: Con Screaming Frog SEO Spider ho scansionato per confronto altri siti di altri utenti qui pubblicati e ricevo sempre l'informazione che esiste la pagina principale "index.html" duplicata con "https://www.zzzzzzzz.it/".
Che ne pensate?
Grazie
Luciano
l'altra pagina è una pagina "fittizia" , non esiste in pratica ma esiste solo logicamente come indirizzo
quindi aggiungi il tag...
Autor
Ciao Claudio e grazie per il tuo commento.
Sarei curioso di capire come mai si crea o meglio (visto che fisicamente pare non ci sia) Google (e altri software) "vede/ono" questa pagina "fittizia" in diversi siti.
Dove posso approfondire questo argomento?
è semplice in pratica digitando l'url di un sito senza specificare una pagina, viene caricata automaticamente la
pagina
index.XXX
oppure su alcuni host la
default.html
Quindi google quando fa la scansione del sito trova sia
https://www.zzzzzzzz.it/
che
https://www.zzzzzzzz.it/index.xxx
e si chiede a quale dare la precedenza...
cercando su google trovi un sacco di info sul canonical...
parti da qui
https://developers.google.com/search/docs/crawling-indexing/canonicalization?hl=it
Autor
Ok, grazie....leggo ed in caso ritorno..
Autor
Ho letto il link suggerito ma non riesco a capire perchè google trova in vari siti (non solo il mio) una pagina che non esiste (https://www.zzzzzzzz.it/) che in effetti non c'è e la considera, per contenuti, duplicata della "index.html".
se il tuo sito , (come tutti), è raggiungibile e mostra la stessa identica pagina/contenuti sia digitando l'url CON e sia digitandolo SENZA il nome della pagina, allora Google vuole sapere quale pagina andrà preferita nell'indicizzazione tra le due o più che secondo lui hanno il contenuto duplicato (essendo la stessa cosa)
esempio
tuosito . it
tuosito . it / index.html
spero di essere stato più chiaro
lo stesso vale per http e https , e anche per quello devi avere la reindirizzazione
Per lui anche senza specificare la pagina per esteso, dato che si apre un contenuto , quella è una pagina a tutti gli effetti