标签归档:robots

WordPress教程之通过robots协议屏蔽搜索引擎抓取网站部分内容

大家做网站难免有些时候不想让某些搜索引擎抓取某些页面,当然可以在根目录下放robots.txt文件屏蔽搜索引擎或者设置搜索引擎可以抓取文件范围以及规则。Robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Protocol),网站通过Robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。 一、Robots协议写法说明 User-agent: 这里的代表的所有的搜索引擎种类,*是一个通配 …