Index Seite wird von Google webmaster immer noch als Duplikat ausgeschlossen
Author: Thomas P.Hallo zusammen
ich hatte dieselbe Frage vor kurzem schon mal und auch Lösungsvorschläge dazu bekommen. Doch die Situation hat sich nicht verbessert. (Wie kann ich eine ehemalige Diskussion wieder aufleben lassen?)
Auf meinen Webseiten retrodesign.ch sowie vintagelamps.ch werden die automatisch generierten Index-Seiten in den Webmastertools immer noch als Duplikate ausgeschlossen.
Ich habe bereits auf meinen index.html-Seiten wie vorgeschlagen unter Eigenschaften im Tab "Erweitert" als benutzerdefinierten Code "Vor dem </HEAD>-Tag folgendes eingegeben:
<link rel="canonical" href="http://vintagelamps.ch/" /> (bzw dito bei retrodesign)
um diese Seiten als kanonisch festzulegen. Seither werden die eigentlichen Domainseiten retrodesign.ch bzw vintagelamps.ch (ohne Index.html-Zusatz) als zwar "gültig, aber nicht in sitemap aufgeführt" bezeichnet ( diejenigen in der Sitemap mit /index.html aber wie gesagt immer noch als Duplikate behandelt.
Fragen:
Wie bekomme ich vintagelamps.ch anstatt vintagelamps.ch/index.html als Hauptseiten in meine Sitemap anstelle von .../index.html
Wie kann ich verhindern, dass Duplikate von meinen Domain bzw Indxseiten erstellt werden, wenn der Code oben nichts nützt?
besten Dank
Thomas
Author
Zusatzbemerkung: Wenn das bei mir so ist, dann müsste das doch bei sämtlichen mit WebsiteX5 erstellten Seiten so sein, dass die Serch Konsole von Google die Domainseite und die automatisch erstellte Index-seite als Duplikate wertet und abstuft...
Oder was hab ich falsch gemacht bzw was muss ich ändern?
Danke Thomas
Möglicherweise noch mit einer .htaccess Datei am Server!
RewriteCond %{THE_REQUEST} ^.*\/index\.html [NC]
RewriteRule ^(.*)index\.html?$ '/$1' [R=301,L]
Ich hatte das gleiche Problem & diesbezüglich auch schon mit Inco kommuniziert.
Wahrscheinlich wird bei allen WSX5 Anwendern die index.html von Google ausgeschlossen.
Alle meine Seiten sind im Februar 2018 von den Top-Positionen ins Nirvana abgerauscht, exakt zu dem Zeitpubkt, als im neuem Google Webmaster die .index.html als doppelter Content angezeigt wurde, weil Google zeitgleich auch ein etwas grösseres Update gefahren hat, mussten höchstwahrscheinlich Seiten leiden, die diese/n Fehler/Meldung aufweisen.
Mein Tipp an Dich: Erstelle dir eine Sitemap bei:
https://www.xml-sitemaps.com
Da wird dann automatisch die Domain und die Domain.index.html mit angegeben.
Evtl. wird Dein Problem dadurch gelöst.
Author
Hallo Uwe
danke für deine Erläuterungen. Tönt nicht gut. Meine Clicks tendieren auch gegen Null. Wenn das allen Usern so passiert, müsste ja wohl Incomedia auch etwas dagegen unternehmen, oder? So von wegen Kundenfreundlichkeit und so... Oder täuscht das?
Fragen:
Wie hast du dein Problem gelöst?
Wenn ich über deinen link eine sitemap erstelle - (ich hab aber iP schon eine xml-sitemap): Muss ich dann zuerst die bestehende kippen vom Server?
Erfasst "deine" auch die Bilder? (Meine Webseite besteht fast nur aus Bildern)
Beim Hochladen der Seite kann man ja jeweils auch die sitemap aktualisieren - funktioniert dann das auch mit der neuen automatisch?
Website x5 erstellt ja die Sitemap automatisch - das wird dann wohl auch in Zukunft so sein, auch wenn ich eine andere an den Server schicke. Wieso soll Google dann die richtige/andere nehmen...?
Besten Dank für deine Hilfe
Thomas
Für den Duplicated Content kann Website nichts, Du solltest eine .htaccess Datei erstellen, mit einer Umleitung auf deine https-Seite.
Bei mir habe ich es so gelöst:
<Ifmodule mod_rewrite.c>
RewriteEngine On
RewriteBase /
RewriteRule ^index\.html$ https://www.deine Seite.ch/? [R=301,L]
RewriteRule ^index\.php$ https://www.deine Seite.ch/? [R=301,L]
RewriteCond %{HTTP_HOST} !^www\. [NC,OR]
RewriteCond %{SERVER_PORT} !^443$
RewriteRule ^(.*)$ https://www.deine Seite.ch/$1 [R=301,L]
</Ifmodule>
Hallo Thomas, Du kannst beide Varianten einfach mal ausprobieren.
Ich habe mich um die Geschichte nicht mehr gekümmert und bin mit meinen Seiten, die auf die Suchmaschinen angewiesen sind, aus mehreren Gründen gewechselt.
Author
Danke Uwe und Andreas
ich werde diese insgesamt 3 Varianten mal ausprobieren.
freundliche Grüsse
Thomas
Author
Zusatzfrage: ich habe jetzt die .htaccess-Datei von Andreas
RewriteCond %{THE_REQUEST} ^.*\/index\.html [NC]
RewriteRule ^(.*)index\.html?$ '/$1' [R=301,L]
hochgeladen. Wenn ich nun www.retrodesign.ch/index.html bewusst in die Suchmaschine eingebe, kommt eine Fehlermeldung statt eine Umleitung zu www.retrodesign.ch (ohne Index)
was mach ich falsch?
Und mit der .htaccess-Datei von Uwe
<Ifmodule mod_rewrite.c>
RewriteEngine On
RewriteBase /
RewriteRule ^index\.html$ http://www.retrodesign.ch/? [R=301,L]
RewriteRule ^index\.php$ http://www.retrodesign.ch/? [R=301,L]
RewriteCond %{HTTP_HOST} !^www\. [NC,OR]
RewriteCond %{SERVER_PORT} !^443$
RewriteRule ^(.*)$ http://www.retrodesign.ch/$1 [R=301,L]
</Ifmodule>
ist gleich die ganze Seite unauffindbar...
Author
Ergänzuung zu obigem: jetzt kommt bei der Datei von Andreas plötzlich keine Fehlermeldung, wenn ich .../index.html eingebe, aber die Index-Seite geht trotzdem auf, ohne dass sie weitergeleitet würde...
Du solltest auch https://www.retrodesign.ch eingeben
Bei mir funktioniert die Weiterleitung ohne Probleme
Author
ja, aber meine URL heisst nicht https sondern http... Wenn ichs ändre kommt eine Sicherheitswarnung
Nochmal die Frage: Wenn ich jetzt wie schon mal versucht die obige .htaccess-Datei von Andreas
RewriteCond %{THE_REQUEST} ^.*\/index\.html [NC]
RewriteRule ^(.*)index\.html?$ '/$1' [R=301,L]
hochlade und www.retrodesign.ch/index.html in die Suchmaschine eingebe, kommt keine Umleitung zu www.retrodesign.ch (ohne Index)
was mach ich falsch?
Die Sicherhaitswarung kommt auch ohne die htaccess-Datei. Die Sicherhaitswarnung kommt die von deinem Virenschutzprogramm? Bei mir meckert Bitdefender wenn ich deine Seite mit https aufrufe. Eventuell musst Du Serverseitig was ändern?
Es gibt ein Problem mit deinem Sicherheitszertifikat:
Author
Trotzdem gerne nochmal die Frage: Wenn ich die obige .htaccess-Datei von Andreas
RewriteCond %{THE_REQUEST} ^.*\/index\.html [NC]
RewriteRule ^(.*)index\.html?$ '/$1' [R=301,L]
hochlade, kommt trotzdem keine Umleitung zu www.retrodesign.ch (ohne Index)
was mach ich falsch?
Danke
Thomas
((PS Dies hat doch nichts mit http oder https zu tun. ich hab kein Sicherheitszertifikat eingerichtet. Meine URL ist http))
Author
ich habs. hab die rewrite engine on - Zeile nicht davor geschaltet. So gehts...
RewriteEngine On
RewriteCond %{THE_REQUEST} ^.*\/index\.html [NC]
RewriteRule ^(.*)index\.html?$ '/$1' [R=301,L]
Schaumer mal, ob immr noch Duplicate erkannt werden...
Vielen Dank erstmal für eure Hilfe
Thomas
Author
Einschränkung: Die Datei funktioniert bei meiner Seite www.retrodesign.ch tadellos - die index-Seite wird weitergeleitet. Bei meiner Seite vintagelamps.ch (auf einem anderen Server, Apache) funktioniert sie jedoch nicht!
Wie kann das sein?
Gute Nacht
Thomas
Wenn du kein Sicherheitszertifikat eingerichtet hast warum wird deine Seite mit https angezeigt?
Author
ich habe noch nie gesehen, dass meine Seite irgendwo mit https angezeigt würde. Im Gegenteil, wenn ich sie mit https anwähle, kommt ja eine Fehlermeldung bzw Sicherheitswarnung. Meine URLs lauten http://www.retrodesign.ch und http://vintagelamps.ch
Wo wird die Seite bei dir mit https angezeigt und wie ist das sonst zu erklären?
Und gerne nochmal die Frage:
Wieso funktioniert die Datei
RewriteEngine On
RewriteCond %{THE_REQUEST} ^.*\/index\.html [NC]
RewriteRule ^(.*)index\.html?$ '/$1' [R=301,L]
nur auf der retrodesign-Seite und nicht auf der vintagelamps-Seite
merci Thomas
Weil das eine Weiterleitung ist. Man kann nicht eine Weiterleitung die auf die richtige URL geht auch beeinflussen.
Hier die Seite mit https:
Author
Andreas: Der Server, auf dem vintagelamps.ch läuft, hatte kein htaccess erlaubt. Inzwischen ist das eingerichtet. Nun geht die Weiterleitung mit der obigen Datei... (Ich weiss nicht, was du damit genau meinst. Es ist ja dieselbe htaccess-Datei - die du mir geschickt hast - und die ist auf dem einen Server mit der einen Seite gelaufen und auf dem anderen Server mit der anderen, unabhängigen, Seite, nicht. Nun gehts bei beiden.
Danke
Thomas
Martin: Das mit dem https check ich nicht. Wenn ich die Warnung überspringe, kann ich meine Seite mit https öffnen, stimmt. Aber ich hab wirklich kein Sicherheitszertifikat eingerichtet und meine Seiten haben wirklich http und nicht https.
Danke
Thomas
Author
Hallo
inzwischen habe ich nicht nur eine index.html sondern auch eine index.php Seite auf dem server und dadurch noch einmal eine duplicate conten mit demselben Inhalt. ich hab zwar die emphohlenen Weiterleitungen gemacht udn sie funktioneiern auch, aber das ist google absolut egal...
Hallo Thomas,
damit für Google deine Seiten eindeutig werden, musst Du in der .htaccess abhängig von der jeweiligen Website eine Umleitung von www auf non-www bzw. non-www auf www einrichten.
Für vintagelamps.ch die Umleitung www auf non-www
RewriteEngine On
RewriteCond %{HTTP_HOST} ^www\.vintagelamps\.ch$ [NC]
RewriteRule ^(.*)$ http://vintagelamps.ch/$1 [L,R=301]
und für retrodesign.ch die Umleitung von non-www auf www
RewriteEngine On
RewriteCond %{HTTP_HOST} !^www\.retrodesign\.ch$ [NC]
RewriteRule ^(.*)$ http://www.retrodesign.ch/$1 [L,R=301]
Das dürfte das Problem beheben.
Author
Hallo Franz-Josef
vielen Dank. Zusatzfrage: weiterleitung www/nonwww nur ENTWEDER per htaccess ODER per canonical tag, oder? Doppelt hält nicht besser?
Und: Ich hab inzwischen die vintagelamps-Seite auf https umgestellt. Danke. War vom Server schon so geplant, nur von meiner Seite aus noch nicht. Bei retrodesign folgts etwas später, da muss ich erst auf dne neuen Server zügeln, der alte kannmir das irgendwi enicht einrichten..
Gruss Thomas
Hallo Thomas,
nein, Du musst beides machen. Vielleicht klärt folgendes Beispiel den Sachverhalt:
Folgende Eingaben im Browser www.vintagelamps.ch, vintagelamps.ch, www.vintagelamps.ch/index.html und vintagelamps.ch/index.html landen alle auf vintagelamps.ch/index.html. Auch für Google sind das aber zunächst drei Seiten mit gleichem Inhalt. Durch den redirect in der .htaccess weiß Google, dass www.vintagelamps.ch gleich vintagelamps.ch ist. Und durch den canonical-Tag in der index.html (<link rel="canonical" href=... />) weiß Google, daß vintagelamps.ch/index.html das Gleiche ist wie vintagelamps.ch.
Author
Hallo Franz Josef
Danke für deine Hilfe. Find ich cool. Also ich hab jetzt folgendes zusammengeschustert:
In der htaccess steht dieses:
RewriteEngine On
RewriteCond %{HTTPS} !=on
RewriteRule ^ https://%{HTTP_HOST}%{REQUEST_URI} [L,R=301]
RewriteCond %{HTTPS_HOST} ^www\.vintagelamps\.ch$ [NC]
RewriteRule ^(.*)$ https://vintagelamps.ch/$1 [L,R=301]
RewriteCond %{THE_REQUEST} ^.*\/index\.html [NC]
RewriteRule ^(.*)index\.html?$ '/$1' [R=301,L]
RewriteCond %{THE_REQUEST} ^.*\/index\.php [NC]
RewriteRule ^(.*)index\.php?$ '/$1' [R=301,L]
PLUS auf der index-Seite Vor dem Head Tag steht folgendes
<link rel="canonical" href="http://vintagelamps.ch/" />
Gut so? Von http auf https, von www auf nonwww, von index.html und php auf ohne ... Reihenfolge auch ok
herzlichen Dank
Thomas
Ja, sieht gut aus. Allerdings könntest Du die Umleitung von index.html und index.php auf "ohne" weglassen, da hier ja der Canonical-Tag greift.
Author
Nochmal für ganz Langsame: Und wieso nicht hier drin lassen und den canonical tag raus?
Ok, stimmt. Der canonical-Tag soll ja bei zwei HTML-Seiten mit gleichem Inhalt bestimmen, welche die bevorzugte Seite sein soll. Es geht natürlich auch per Redirect in der htaccess. Aber ich weiss nicht, welche Auswirkung hier die Einträge in der sitemap.xml nach sich ziehen, denn hierin stehen konkrete Seiten; auch die index.html. Also ich verwende die canonical-Tags...
Wenn es Dich interessiert: weitere Informationen zu dem Thema findest Du hier
https://de.ryte.com/magazine/canonical-vs-301-redirect-die-richtige-loesung-zum-richtigen-zeitpunkt
Author
Danke. Interessante Seite. Als Canonical scheint die index.html udn php sinnvoller zu sein, stimmt. Aber SCHADET es irgendwas, wenn ichs zusätzlich in der htaccess habe? Ist doppel gar kontraproduktiv? (Google hat bis jetzt eben noch nicht gemerkt, dass ich versuche, den duplicate content zu eliminieren?
Gruss Thomas
Nein, meines Erachtens schadet es nicht so etwas doppelt zu haben. Google ist in dem Fall kein Schnellmerker, da es sich ja so viel merken muss. Deine Seiten sind jetzt so im Index und wenn Google das nächste Mal Deine Seiten scannt wird die Änderung erst registriert..