如何删除搜索引擎中的URL(被收录页面)
删除单个页面可以通过以下几种方式:
通过robots.txt文件拦截搜索引擎收录,注意相关书写规则,切忌弄巧成拙。
通过noindex元标签拦截页面阻止其被索引。
这种方式是通过返回一个404或410状态码表示当前页面不存在。可以使用Fetch as Googlebot,或者Live HTTP Headers或web-sniffer.net之 类的工具来确认该URL确实返回了正确的代码。有时,“已删除”的页面可能会显示“404”或“无法找到该页面”,但却在页头返回一个200状态码。因此 最好使用适当的页头核对工具复查一遍。
最好的当然还是通过谷歌站长工具来移除,快准狠。
删除整个网站:
第一、通过robots.txt文件删除;
第二、仅限谷歌!通过谷歌站长工具删除;
noindex 元标记标准在 http://www.robotstxt.org/meta.html 上有具体介绍。如果您不具备对服务器的根访问权限,此方法将非常有用,因为它允许您逐页控制对网站的访问。
要防止所有漫游器将网站中的网页编入索引,请将以下元标记添加到网页的部分:
<meta name=”robots” content=”noindex”>
要允许其他漫游器将网站中的网页编入索引,仅阻止 Google 的漫游器对网页采取同样操作,请将以下元标记添加到网页的部分:
<meta name=”googlebot” content=”noindex”>如果 Google 看到某一页上有 noindex 元标记,就会将此页从我们的搜索结果中完全丢弃,而不管是否还有其他页链接到此页。但是,其他搜索引擎可能会以不同的方式解译此指令。因此,指向相关网页的链接可能仍会显示在搜索结果中。
请注意,由于我们必须抓取您的网页才能看到 noindex 元标记,因此在极少数情况下 Googlebot 可能会看不到和不遵循 noindex 元标记。如果您的网页仍显示在搜索结果中,可能是因为在您添加标记后我们尚未抓取过您的网站。(此外,如果您使用了 robots.txt 文件拦截此网页,我们也无法看到此标记。)
如果内容当前出现在我们的索引中,我们会在下次抓取此内容时将其删除。要加快删除过程,请使用 Google 网站管理员工具中的网址删除请求工具。
版权声明:如何删除搜索引擎中的URL(被收录页面)系原创文章,转载请注明出自Bruce[http://brucehan.com]
