Donnerstag, 31. Juli 2008
Der verflixte Google-Cache und wie ich mein Blog da raus bekomme
Textvorschlag zwecks Aufnahme in die FAQ. Diskussion willkommen.

Gelegentlich schallt durch das Hilfeblog der panische Ruf nach Löschung des Blogs aus dem Google-Cache, aus urheberrechtlichen Gründen oder weil man unbedacht Namen von Personen genannt hat, die lieber ungenannt geblieben wären. Leider haben die blogger.de-Administratoren keinerlei Zugriff auf diesen Google-Cache; daher sind Aufforderungen an Sie, diesen Cache doch bitte zu löschen, auch wenn sie noch so vehement vorgetragen werden, vollkommen aussichtslos. Diese Löschung können nur Sie als Blogbesitzer veranlassen. Wie das funktioniert, soll im folgenden beschrieben werden.

Wichtig: Nicht in Panik verfallen und gleich das gesamte Blog löschen lassen! Es ist für das beschriebene Verfahren wichtig, dass das Blog weiterhin existiert und Sie Admin-Zugriff darauf haben. Außerdem muss das Blog für die gesamte Dauer der Prozedur, bis zum endgültigen Entfernen der Einträge durch Google, auf 'public' gesetzt werden. Den verfänglichen Eintrag können Sie allerdings gerne löschen, oder, noch besser, mit einem unverfänglichen Text überschreiben.

Das Verfahren funktioniert nur, wenn Sie Zugriff auf den Quellcode des Blogs haben. Grund: Google will natürlich sicher gehen, dass Sie berechtigt sind, das Blog entfernen zu lassen, dass es also tatsächlich Ihr Blog ist. Deshalb wird Google Sie bitten, einen Eintrag in den Quellcode des Blogs vorzunehmen. Dazu ist nur der Administrator in der Lage. Sobald Sie den Eintrag vorgenommen haben und Google dies positiv geprüft hat, gelten Sie daher als autorisiert, allerley Dinge festzulegen im Umgang von Google mit Ihrem Blog. Unter anderem eben auch die Löschung aus dem Cache. So gehts:

Besorgen Sie sich einen Google-Account:
https://www.google.com/accounts/NewAccount
(Haben Sie schon eine Googlemail-Adresse, dann können Sie diesen Schritt überspringen, denn dann besitzen Sie bereits einen Account.)

Loggen Sie sich mit Ihrem Google-Account ein und gehen Sie zu den Webmastertools: http://www.google.com/webmasters/tools

Tragen Sie die URL des zu entfernenden Blogs (also http://ihrblog.blogger.de) in das Formularfeld ein und klicken Sie "Add Site".

Klicken Sie auf "Verify your site" Jetzt bietet Google Ihnen zwei Alternativen an:

(a) Upload an HTML file: Erstellen Sie eine (leere) Datei des angezeigten Namens und laden Sie diese z.B. via FTP hoch. Das funktioniert nicht für ein blogger.de-Blog.

(b) Add a meta tag: Google zeigt eine Zeichenfolge, die Sie in den HTML-Code ihres Blogs einfügen müssen. Genau das benötigen wir.

Sie gehen also nach Verfahren (b) vor. In einem zweiten Browserfenster öffnen Sie ihr Blog, loggen sich ein und öffnen über Layouts -> Skins - Site Layout -> Main Page den Quellcodeeditor. Direkt unter dem Eintrag <head> (ziemlich weit oben) fügen Sie zwei Zeilen ein:

(a) Die von Google angezeigte Zeile der Form
<meta name="verify-v1" content="....langer Ausdruck...." />

(b) Zusätzlich die Zeile
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">

Speichern nicht vergessen!

Jetzt gehen Sie wieder zu den Google-Tools und klicken auf "verify". Google prüft nun Ihre Seite auf den soeben vorgenommenen Eintrag. Ist die Prüfung erfolgreich, können Sie endlich das Blog aus dem Cache werfen, und zwar über "Tools" -> "Remove URLs" im linken Menü.

Die geforderten Voraussetzungen sind erfüllt, klicken Sie daher auf "New Removal Request" und wählen Sie "Your entire site", um die gesamte Seite aus dem Google-Index zu entfernen. Die Sicherheitsabfrage bestätigen Sie. Diesen Schritt wiederholen Sie noch einmal: Erneut "New Removal Request" klicken, jetzt jedoch "Cached copy of a Google search result" wählen und bestätigen. Damit wird auch der Google-Cache bereinigt.

Dieser Vorgang kann allerdings ein paar Tage dauern, also bookmarken Sie sich am besten die Seite und schauen bei Gelegenheit mal nach, ob der angezeigte Status sich von "pending" zu "removed" geändert hat.

Wichtig: Google und auch andere Suchmaschinen werden ab sofort Ihr Blog nicht mehr in den Index aufnehmen. Ging es Ihnen nur darum, einen alten Eintrag zu tilgen, ohne auch in Zukunft unauffindbar zu sein, dann warten Sie, bis Google Ihren Löschauftrag ausgeführt hat und entfernen danach die Zeile unter (b) (<META NAME="ROBOTS" ...) wieder aus dem Quellcode Ihres Blogs.

Wichtig: Beim Bereinigen des Google-Caches haben Sie auch die Möglichkeit, den direkten Link zur entsprechenden Story anzugeben. Dann wird nur diese gelöscht. Das ist allerdings nicht zu empfehlen, da Stories bei blogger.de unter verschiedenen URLs erreichbar sind. Die FAQ können Sie beispielsweise unter vier verschiedenen Adressen erreichen: http://hilfe.blogger.de/stories/488363/ oder http://hilfe.blogger.de/20060627/ oder http://hilfe.blogger.de/?day=20060627 oder http://hilfe.blogger.de/topics/FAQ/ Daher ist es immer sicherer, zunächst das gesamte Blog aus dem Cache zu werfen und dann gegebenenfalls neu indizieren zu lassen.

Liest sich gut und sinnvoll. Es sollte nur auch ganz oben noch irgendwo vermittelt werden, dass das Blog für die gesamte Prozedur 'öffentlich' sein muss.

Also vom initialen Check durch Google bis zum kompletten entfernen der Bloginhalte aus dem Google-Cache.
dirk olbertz, 31. Jul 2008, 15:31  | link
 
[x] Done
ichichich, 01. Aug 2008, 12:46  | link
Großartig, Herr Ichichich. Sehr schön beschrieben und sicherlich Balsam für so manche gequälte Seele, die ihren formuliererischen Übermut bereut.

Hilfreich fände ich auch noch einen Hinweis, dass die Löschung aus dem bösenbösen elefantengedächtnisartigen Google-Cache eine eventuell vorgefallene Urheberrechtsverletzung oder gar die Verletzung persönlicher Rechte durch einen (weiterhin bestehen bleibenden) Blogbeitrag nicht ungeschehen macht und keinesfalls ein Freifahrt- oder Persilschein für sprachliche Vergehen jeder Art sein kann.

Ob ein solcher Hinweis in einer technischen Hilfe angebracht ist, weiß ich auch nicht so genau, aber Sie und Ihre Kollegen sorgen ja sonst auch für alle möglichen Nöte und Ungelenkigkeiten der Gemeinde hier... Danke dafür.
hora sexta, 31. Jul 2008, 18:23  | link
Liest sich gut. Ich kann in der FAQ hierhinverweisen.
kid37, 01. Aug 2008, 12:18  | link
 
Das hat wohl schon jemand getan.
ichichich, 01. Aug 2008, 12:46  | link
 
Wichtiges erledige ich immer gleich ;-)
kid37, 01. Aug 2008, 14:47  | link
 
Aber ist es wirklich so wichtig, dass man es gleich zweimal reinschreiben muss?

http://hilfe.blogger.de/stories/488363/#ch1.11
http://hilfe.blogger.de/stories/488363/#ch4.1
ichichich, 01. Aug 2008, 15:01  | link
 
Wahrscheinlich nicht. Punkt 4.1 ist jedenfalls nicht von mir.
kid37, 01. Aug 2008, 15:03  | link
 
4.1 habe ich gestern geschrieben.
kinomu, 01. Aug 2008, 15:22  | link
 
Ah, guten Morgen, brauche Brille. Da habe ich gepennt, ich bin kurz drüber geflogen und sah nichts. Dann nehme ich jetzt 1.11 wieder raus. Sorry.
kid37, 01. Aug 2008, 15:28  | link
 
Funktioniert bei mir leider nicht, bekomme von Google jeweils ein abgelehnt zurück ;-(((((
myrose, 16. Mai 2009, 14:17  | link
ich schaff das nicht..


ich hab da kein "remove"

ich adde die seite
trag den quellcode in meinen blog an die richtige stelle

er überprüft das
es wurde überprüft und ich
und weiter komm ich nicht

kann mir bitte jemand helfen?
ich hab dann bei den webmastertools kein remove url
oder new removel request

oder ist gemeint, dass ich die seite wo ich sie im tools eingetragen habe, wieder delete?


ich hab auch keinen pending status?!
???

lg
missmieze, 01. Aug 2010, 16:23  | link
 
Kein Wunder, die Anleitung ist inzwischen nicht mehr aktuell. Die derzeit nötigen Schritte habe ich mitgeschrieben, während ich die Löschung für dich veranlasst habe, aufdaß es andere leichter haben:

Loggen Sie sich mit Ihrem Google-Account ein und gehen Sie zu den Webmastertools: http://www.google.com/webmasters/tools

Klicken Sie "Add a site..." und tragen Sie die URL des zu entfernenden Blogs (also http://ihrblog.blogger.de) in das erscheinende Formularfeld ein (bei Ihrem Browser muß JavaScript aktiviert sein), dann "continue".

Öffnen Sie in einem zweiten Browserfenster ihr Blog, loggen sich ein und öffnen über Layouts -> Skins - Site Layout -> Main Page den Quellcodeeditor. Direkt unter dem Eintrag <head> (ziemlich weit oben) fügen Sie zwei Zeilen ein:

(a) Die von Google angezeigte Zeile der Form
<meta name="google-site-verification" content="....langer Ausdruck...." />

(b) sowie zusätzlich die Zeile
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">

Speichern nicht vergessen!

Jetzt gehen Sie wieder zu den Google-Tools und klicken auf "Verify". Google prüft nun Ihre Seite auf den soeben vorgenommenen Eintrag. Ist die Prüfung erfolgreich, können Sie endlich das Blog aus dem Cache werfen: im linken Menü wählen Sie "Site configuration" -> "Crawler access", anschließend klicken Sie auf "Remove URL" und "New removal request", in das erscheinende Formularfeld tragen Sie die URL des zu entfernenden Blogs (also http://ihrblog.blogger.de) ein, klicken Sie"Continue".

Auf der nächsten Seite markieren Sie die Box neben "The content has been blocked by robots.txt" und klicken Sie "Submit Request".

Da das Entfernen Ihres Blogs aus dem Google-Cache ein paar Tage dauern kann, bookmarken Sie sich am besten die Seite und schauen bei Gelegenheit mal nach, ob der angezeigte Status sich von "pending" zu "removed" geändert hat.

Wichtig: Google und auch andere Suchmaschinen werden ab sofort Ihr Blog nicht mehr in den Index aufnehmen. Ging es Ihnen nur darum, einen alten Eintrag zu tilgen, ohne auch in Zukunft unauffindbar zu sein, dann warten Sie, bis Google Ihren Löschauftrag ausgeführt hat und entfernen danach die Zeile unter (b) (<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">) wieder aus dem Quellcode Ihres Blogs.

Wichtig: Beim Bereinigen des Google-Caches haben Sie auch die Möglichkeit, den direkten Link zur entsprechenden Story anzugeben. Dann wird nur diese gelöscht. Das ist allerdings nicht zu empfehlen, da Stories bei blogger.de unter verschiedenen URLs erreichbar sind. Die FAQ können Sie beispielsweise unter vier verschiedenen Adressen erreichen: http://hilfe.blogger.de/stories/488363/ oder http://hilfe.blogger.de/20060627/ oder http://hilfe.blogger.de/?day=20060627 oder http://hilfe.blogger.de/topics/FAQ/ Daher ist es immer sicherer, zunächst das gesamte Blog aus dem Cache zu werfen und dann gegebenenfalls neu indizieren zu lassen.
kinomu, 01. Aug 2010, 22:24  | link
 
Super.

Da Sie grad so fleißig sind - wie wärs mit einem Test (FAQ in Farbe und sehen, wie schnell dann wieder einer dort nicht drin gelesen hat? Habe da so eine - wie krieg ich mein Blog - Sache im Visier *g* Und ja, ich geb erst Ruh, bis ich gesehen hab, daß das nix ändert *fg*) ?
sid, 01. Aug 2010, 23:03  | link
 
du hast mich scho löschen lassn aus google?


du bist ein goldschatz!

juhuuuu
missmieze, 02. Aug 2010, 16:21  | link
 
Die Löschung meines kompletten Blogs aus dem Google-Cache funktioniert bei mir nicht, da ich trotz Änderung in Layouts -> Skins -> Search robot restrictions keinen Einfluss auf die robots.txt Datei meines Blogs habe. Dort habe ich folgenden Eintrag versucht vorzunehmen, welcher jedoch offensichtlich ignoriert wird:

User-Agent: *
Disallow: /

Ohne explizites "Disallow: /" für alle Googlebots, weigert sich Google mein Blog aus dem Cache zu löschen und lehnt jeden Antrag auf Löschung ab.... =(

Bitte um Hilfe.
otaku85, 01. Feb 2011, 17:31  | link
 
Ich habe es mit Meta tags gemacht:

<*META NAME="ROBOTS" CONTENT="NOARCHIVE"*>

In den Header (ohne Sternchen).
strappato, 01. Feb 2011, 17:51  | link
 
Hatte ich auch, trotzdem vielen Dank für den Hinweis.

[edit] Bei mir bringt dieses Tag offenbar nichts. Da die robots.txt offenbar höhere Priorität hat als Tags auf der Seite... Hiermit bitte ich höflichst um mehr Einfluss auf die robots.txt . Insbesondere würd ich deren Inhalt gerne auf Folgende beiden Zeilen reduzieren:

User-agent: *
Disallow: /
[/edit]

Ändert aber nichts an der Tatsache, dass User keinen Einfluss auf die robots.txt Datei haben und somit auf die manuelle Löschung aus dem Google-Cache :-(

Nun heißt es wohl abwarten bis der Crawler es für nötig hält mein Blog unter die Lupe zu nehmen und den Cache zu aktualisieren (bzw. löschen).
otaku85, 01. Feb 2011, 18:03  | link