Robots datei einstellungen
Autor: Michael G.Hallo,
ich habe eine Webseite auf deutsch erstellt und möchte diese auch auf englisch haben.
Nun kopiere ich das Projekt und habe ja beide Webseiten zur Verfügung.
Jetzt habe ich alles überetzt und verlinkt und die Webseite mit der englischen Sprache in einem Unterordner auf dem Server gespeichert. Auf der Haupt Ebene auf dem Webserver liegt jetzt die Index.html Dateifür die deutsche Webseite und für die englische Webseite habe ich natürlich auch eine Index.html Datei, die ja in meinem Unterordner positioniert ist.
Was gebe ich jetzt erstens bei den Projekteinstellungen (englische Webseite) unter "Allgemeine Einstellungen" bei URL der Webseite an?
Und wie stelle ich zweitens dann dierobots.txt Datei ein?
Muss ich das Projekt mit der deutschen Seite öffnen und die Unterseite, wo alle Projektdaten der englischen Webseite liegen komplett ausschließen und im Projekt mit der englischen Webseite die ganzen Ordner die auf der Hauptebene liegen im Gegenzug auch ausschließen?
Und drittens, wie liest Google diese Seiten aus, die keine eigene Domain haben, und in einem Unterordner liegen. Ich kann ja bei Google nur die Domain angeben und keine Unterordner für eine Webseite.
Oder sehe ich alles verkehrt und ich brauche das alles nicht einstellen in solch einem Fall?
Gruß,
Michael
Hallo!
Also teilweise kann ich Dir wohl helfen:
In den allgemeinen Einstellungen schreibst Du einfach http.://meinewebseite/unterordner.
Auch beim Export gibst Du den Unterordner an.
Die Sprachwahl könntest Du ja mittels einer Intro-Seite realisieren.
Das mit Google macht bestimmt einer der fähigen Mods hier ;-)
Autor
Hallo Michael B.,
ja danke für die Antwort, mich interessieren natürlich noch die anderen Fragen.
Mit der Intro Seite bin ich nicht so zufrieden, ich würde lieber Fahnen im Hauptbanner positionieren und dann kann jederzeit die Sprache gewechselt werden. Falls mal ein Deutscher durch einen Querlink im Internet auf eine der englischen Seiten landet, hat dieer ja keine Möglichkeit mehr zu wechseln, weil er ja nicht auf der Hauptseite (Introseite) gelandet ist.
Und was macht der dann, er verlässt die Seite und kommt vielleicht nie wieder?
gruß
Michael
Hi Micheal,
Bilder mit den Fahnen (passend zur Sprache) in den Header und diese verlinken zu deiner HP (Adresse) meinst du das so
Gruß
Autor
hay Bernd,
ja das meine ich, aber meine Frage betrifft eigentlich die robots.txt datei, meine ersten Fragen ganz oben.
lg
Michael
du weißt was die robots.txt für einen Sinn hat?
http://de.selfhtml.org/diverses/robots.htm
Autor
Hallo Zwoemi,
ja, Ordner und Datein ausschließen, so das diese nicht erfasst werden von Google um Double Content zu vermeiden oder aus anderen Gründen, ob das bei mir Sinn macht versuche ich gerade herauszubekommen, also verstehe ich die Gegenfrage nicht, hab ich mich nicht präzise genug ausgedrückt?
Nochmal, meine Frage war, wie Google das ausliest, ob Google die englische Version dann auch als einzelne Webseite mit all seinen Unterseiten ansieht und ob ich das in meinem Fall irgendwie mit der robots.txt angeben oder steuern muss oder nicht. Wie gesagt, es geht speziell um die Tatsache die zweite Website halt nicht eine eigene Domain hat.
Wäre sehr nett wenn jemand eine Antwort hat, danke,
gruß
Michael
Autor
So das die Seiten getrennt behandelt werden, ist das Sinnvoll oder egal?
Wieso sollte das doppelter Content sein? Andere Sprache anderer Inhalt.
Stell dir doch selbst die Frage...
Soll die Seite indexiert werden oder nicht?
Ich habe extra den Link geschrieben damit du lesen kannst wozu die zuständig ist.
Dein letzter Satz zeigt mir das du nicht gelesen hast....
http://de.selfhtml.org/diverses/robots.htm
Die robots.txt muss unter diesem Namen (alle Buchstaben klein geschrieben) im Wurzelverzeichnis der Web-Dateien der Domain abgelegt werden. Wenn Sie also einen Domain-Namen example.org haben, dann muss die robots.txt in dem Verzeichnis abgelegt werden, in dem auch die oberste Einstiegsdatei von www.example.org liegt. Der URI wäre also http://www.example.org/robots.txt Nur so kann sie von Suchmaschinen-Robots, die das Projekt aufsuchen, gefunden werden. Das bedeutet, dass Sie die Technik der robots.txt nur nutzen können, wenn Sie eine eigene Domain haben, nicht aber bei Webspace-Angeboten, wo Sie lediglich ein Homepage-Verzeichnis auf einem Server erhalten, ohne an das Wurzelverzeichnis der Domain zu kommen.
doppelten Content gibt es durch www und ohne erreichbar und durch zwei Domains und keine getrennten Verzeichnisse für die Domains.
kurz gesagt die robots.txt im Unterordner hat keinen Sinn.
Autor
Hallo Zwoemi,
du hast recht, diesen Abschnitt habe ich nicht gelesen, nur den darüber.
Mit doppelten Content war nur ein Beispiel auf deine Frage, ob ich wüsste was die robots.txt datei bewirkt. Das war in meinem Fall auch nicht die Frage, ich wollte lediglich wissen, ob ich bei beide Webseiten(Projekten) die robots.txt haben sollte, und ob es in meinem Fall mit dem Unterordner Sinn macht.
Deinem Rat nach und nachdem was ich jetzt da gelesen habe, ist es also dann besser nur die robots.txt in der hauptdomain zu haben und für alle unterordner mit den Webseiten in den anderen Sprachen dann keine robots.txt zu setzen, oder?
gruß,
Michael
mit der robots schließt du keinen doppelten Content aus....
Es wird eine benötigt....diese kann auch leer sein wenn du keine Einschränkungen notieren willst. Aber zweckmäßig wird natürlich gesagt ja ihr Crawler indexiert meine Seiten...
http://unofficialwsx5.de/index.php/Thread/254-htaccess-Weiterleitung-ohne-und-mit-www-Duplicate-Content/
Autor
Ahh ok, ich dachte ich kann damit soetwas wie doppelten Content vermeiden, wenn ich zwei Webseiten habe und auf beiden gibt es eine Unterseite mit gleichem content, und eine davon schließe ich anhand der robots.txt aus von den suchmaschinen, so das nur eine gecrawlt wird, wäre das also falsch? mhh, habe ich da was völlig falsch verstanden?!!
Danke dir für den Link.
Zusatzfrage: Ich kann doch bei Google angeben, welche Seite ich bevorzuge, also www.meine-webseite.de oder meine-webseite.de.
wenn ich das mache, muss ich trotzdem die .htaccess datei anlegen?
sorry, jetzt hat mich das etwas verwirrt,
gruß,
Michael
Lesen...gibt genug Stoff im Netz dazu
http://www.suchmaschinentricks.de/aktuelles/seo/1468.php
das Forum ist nicht dazu da dir alles kleinlich zu erklären wie man welche Datei nutzt.
Gibt es für dich nur google? Oder gibt es noch andere Suchmaschinen?
Autor
Schon ok Zwoemi, brauchst mir nicht mehr antworten wenn es du nicht magst, kein Ding.
Danke nochmal für den Link und schönes Wochende noch.
Und ja, es gibt für nur Google, sonst nichts weiter.
Danke für den Link http://www.suchmaschinentricks.de/aktuelles/seo/1468.php
Sollte unerfahrenen Usern helfen.
Gruß
Peter
Autor
Danke Peter, das ist nett, schönes Wochenende,
Michael
@Michael G.
Gerne, auch wir möchten immer besser werden :-). Haben schon einige Lösungsansätz von Zwoemti hier gefunden.
lG Peter