做SEO的都知道404状态码,但事实上,404页面有“软硬之分”,“硬404”即是指平时我们所说的针对无效资源返回404状态码,而“软404”则是指针对无效的资源,本应返回“404”状态码,服务器却返回的是 其他的状态码。

如果针对不存在的网页返回 404 或 410 以外的代码,如将用户重定向至首页,而不是返回 404,则可能会出现问题。首先,这样就等于告诉搜索引擎通过该网址可以找到实际的网页。结果,搜索引擎可能会抓取该网址,并将其内容编入索引。因为 Googlebot 要使用很多的时间处理不存在的网页,可能无法迅速找到您的网址或频繁访问这些网址,也无法频繁地访问这些网址,从而影响对您网站内容的抓取量。
不要以为做一个404页面就OK了,404页面与服务器返回的 404 响应不是一回事。
还有大量不存在的页面重定向至首页也是不友好的用户体验,会让顾客感到蛋疼。最后搞这么多301跳转,也有作弊的嫌疑,最坏的情况就是网站首页被K不收录。
那么404错误到底该怎么解决?国外有同行已经说得很清楚:http://www.gravitateonline.com/learn-seo/traditional-404-errors-vs-soft-404-errors
1. For the soft 404s, determine whether the URL:
a. Contains the correct content and properly returns a 200 response
b. Should 301 redirect to a more accurate URL
c. Doesn’t exist and should return a 404 or 410 response
2. Confirm that you’ve configured the proper HTTP Response by using Fetch as Googlebot in Webmaster Tools
3. If you now return 404s, you may want to customize your 404 page to aid y our users. Google’s custom 404 widget can help.
扯了这么多,就一个意思,网站实际的情况要跟服务器的状态码一致,不然你就是软404,软301,软200...