Indicizzazione
Autore: Roberto M.
Visite 740,
Followers 2,
Condiviso 0
Sono sei giorni che tento di caricare la sitemap ma non me la fa caricare. se chiedo l'idicizzazione mi da il seguente risultato:
se punto la sitemap dal browser me la fa vedere normalmente
Non vorrei che ci fosse qualche problema sul file robot.txt che è così composto:
User-agent: *
Disallow: /admin
Disallow: /captcha
Disallow: /imemail
Sitemap: http://localhost/sitemap.xml
Non riesco proprio a capire dove sbaglio. In 5 anni che uso WS è la prima volta che mi capita. Non so che pesci prendere. Ho provato a ricostruire il sito senza alcun codice ma niente sempre la stessa cosa. Il sito è su aruba su server linux
Postato il
Autore
Correggo: la stringa finale del robot è: Sitemap: https://www.cecprogetti.eu/sitemap.xml
non si vede molto dalle immagini...
ma , da quel poco che si vede, WebsiteX5 non centra, a mio parere sei nella pagina sbagliata sulla GSC
sei in "controllo url" , dove si verificano le singole pagine
devi andare in Sitemap !!! è da lì che la Sitemap si carica ! ... qui...
si come dice Claudio può inavvertitamente succedere se sbagli ad inserire la sitemap.xml, io sbadatamente una volta ho inserito sitemap.xlm
si vero...
ma dalle immagini direi che Roberto è andato nella sezione sbagliata.
La sitemap si invia da "sitemap" non da "controllo url", come sembra capire dalle sue immagini...
si ma lui è in "controllo url"
leggi e guarda cosa c'è evidenziato
si si avevo visto (dopo però)
Autore
La site map è stata caricata da dove si deve caricare.L'ultimo stamp riguarda una chimata all'index per l'indicizzaione che poi viene rifiutata. Mai capitata una cosa del genere!!
Autore
questa è la sitemap attuale
==========
<urlset>
<url>
<loc>https://www.cecprogetti.eu/index.html
<lastmod>2024-05-25</lastmod>
<changefreq>monthly</changefreq>
<priority>0.5</priority>
</url>
<url>
<loc>https://www.cecprogetti.eu/messaggio.html
<lastmod>2024-05-24</lastmod>
<changefreq>monthly</changefreq>
<priority>0.5</priority>
</url>
<url>
<loc>https://www.cecprogetti.eu/privacy.html
<lastmod>2024-05-24</lastmod>
<changefreq>monthly</changefreq>
<priority>0.5</priority>
</url>
<url>
<loc>https://www.cecprogetti.eu/cookie-policy.html
<lastmod>2024-05-24</lastmod>
<changefreq>monthly</changefreq>
<priority>0.5</priority>
</url>
<url>
<loc>https://www.cecprogetti.eu/services.html
<lastmod>2024-05-24</lastmod>
<changefreq>monthly</changefreq>
<priority>0.5</priority>
<image:image>
<image:loc>
https://www.cecprogetti.eu/images/pattern-1508277_1280.jpg
</image:loc>
</image:image>
<image:image>
<image:loc>https://www.cecprogetti.eu/images/qHPC6p.jpg
</image:image>
<image:image>
<image:loc>
https://www.cecprogetti.eu/images/wallpaperflare.ciouyiuyom_wallpaper.jpg
</image:loc>
</image:image>
</url>
<url>
<loc>https://www.cecprogetti.eu/sudinoi.html
<lastmod>2024-05-24</lastmod>
<changefreq>monthly</changefreq>
<priority>0.5</priority>
<image:image>
<image:loc>https://www.cecprogetti.eu/images/485303.jpg
</image:image>
</url>
<url>
<loc>https://www.cecprogetti.eu/contattaci.html
<lastmod>2024-05-25</lastmod>
<changefreq>monthly</changefreq>
<priority>0.5</priority>
</url>
</urlset>
Autore
Dal competitor Bing invece viene letta normalmente come parimenti dicasi le pagine del sito.
Autore
Questo è lo stam per il trasferimento dei file e funziona.
Autore
I vari tools di controllo mi dicono:
URL della mappa del sito non definito nel file robots.txtLa mappa del sito non restituisce l'intestazione del tipo di contenuto correttaTipo di fileIl file della mappa del sito contiene erroriDimensioni del file1836Numero di collegamento72 erroriAvviso 0Pos.LineaDichiarazione 2XML consentita solo all'inizio del documento0Impossibile analizzare la risorsa XML '/var/www/wspstage.mentorvpn.com/sitemap-webtool/xsd/custom.xsd'.
==========
Sitechecker ha riscontrato difficoltà durante la scansione di questo sito web.Il nostro bot è progettato specificamente per accedere a siti Web con il tipo di contenuto impostato come testo/html.Assicurati che il tuo sito web sia accessibile e abbia il tipo di contenuto appropriato nell'intestazione HTTP affinché il nostro sistema possa analizzarlo in modo efficace.
==========
Con Aspose
Sitemap is valid Errors: 0Warnings: 0
==========
XML Sitemap Checker Result for www.cecprogetti.eu/sitemap.xml Your website appears to have an XML sitemap. OK
Autore
Questo è l'attuale robot.txt
User-agent: *
Disallow: /admin
Disallow: /captcha
Disallow: /imemail
Sitemap: https://www.cecprogetti.eu/sitemap.xml
scusa Roberto, ma non eri stato per nulla chiaro ...
avresti dovuto sin da subito mettere questa immagine
e si è decisamente strana come cosa... ma già vista qualche volta...
stasera ci dò un occhio...
Autore
Si ti chiedo scusa claudio colpa mia
Autore
Da quello che penso io ma probabile penso male, è come se ci fosse qualcosa sull'header che gli da fastidio. Siccome era stato messo fisso ora ho ricambiato . Ho tolto il codice che faceva rimanere fisso l'header e ho fatto scendere la stiky bar. Ora vado a svuotare la cache su aruba poi riprovo.
se hai la cache attiva di Aruba toglila.
fa un sacco di danni con i siti ancora non definitivi
Autore
Tolta claudio comunque riaprendo il sito bisogna x forza rigenerarla altrimenti si vede sempre il vecchio. Ora c'è la stiky bar ma il responso rimane tale e uguale. NON CARICA STA MALEDETTA SITEMAP.
ma no l header o le pagine non centrano
non legge la sitemap, quindi o
robots.txt o htaccess o cache sull host
il problema è in uno dei tre
Autore
Per completezza posto anche htacces:
========
# WebSite X5 - Start Code [do not edit]
<IfModule mod_deflate.c>
SetOutputFilter DEFLATE
</IfModule>
# WebSite X5 - End Code
Autore
Chiedo ai moderatori: E' possibile per voi tagliare e incollare in un unico post tutte le criticità già postate? Questo consentirebbe al visitatore di avere subito il quadro generale della situazione. Sto forum non avendo la funzione di modifica mi sembra WA dove alla fine non si capisce più nulla.
Autore
Dulcis in fundo ecco il risultato di google sul robot. Eppure c'è !!
non c'è dubbio che hai qualche problema con Google che per qualche motivo non riesce ad accedere al tuo sito. Visto che dici che con gli altri (bing) è tutto ok...
Ho provato pure io vari tool ma non sembrano rilevare problemi ... proprio ora
https://technicalseo.com/tools/robots-txt/
ed accede tranquillamente..., ma poi se a Bing, piace , ovvio che è google che ha problemi.
Contattare Google in merito non è facile... tranne dal forum di assistenza , ma provaci...
https://support.google.com/webmasters/thread/new?hl=en&sjid=6557691687273355396-EU
Io eliminerei la proprietà del sito dalla GSC e poi la rimetterei... , supponendo non peggiori... ma d'altronde se non "assorbe" la sitemap , che ci fai...
ricordati di lasciare la cache dell'host disattivata.
Autore
Grazie Claudio si avevo pensato pure io di eliminare la proprietà e ricrearla di sana pianta.