masalibの日記

システム開発、運用と猫の写真ブログです

ソフト404エラーについて

経緯

WEBマスターツールのダッシュボートに
クロールエラーというのがあります
そちらをクリックすると
クローラーのエラーの状況が表示されます

f:id:masalib:20150731140412j:plain

その中のソフト404エラーという
一般的なHTTPステータスコードじゃないものを見つけました

f:id:masalib:20150731140429p:plain

そのエラーを調べた事について記載します

クローラーエラーについて

エラーを放置した状態にすると
ランキングが下がる可能性があるそうです

Googlebot の時間が消費されるため、
所有している固有の URL の検出が遅れたり、
アクセスの頻度が少なくなったりする可能性があります

googleより引用

エラーの対応について

・500エラーとかはプログラムのエラーなのですぐに修正が必要です
・404エラーはリンク切れなのでリンク元を修正しています
 参照元をみてもし自分のサイトではない外部リンクの場合は
 外部に依頼するか、またはrobotテキストで対応する

困ったエラーがあります
今回の表題のソフト404エラーです

ソフト404エラーとは

サーバーでは、存在しないページへのリクエストに応答する際に、404 コードを返すだけでなく、404 ページも表示します。
「ファイルが見つかりません」という標準メッセージが表示される場合もありますが、
追加情報が記載されたカスタム ページが表示されることもあります。
ページのコンテンツは、サーバーから返される HTTP レスポンスとはまったく関係ありません。
ページに「ファイルが見つかりません」という 404 メッセージが表示されたとしても、
そのページが 404 ページであるとは限りません。
キリンが「犬」という名札を付けているようなものです。名札に犬と書かれていても、実際には犬ではありません

googleより引用


自分は下記のように解釈しています


ファイル存在はしているけど、
内容(コンテンツ)は存在していない状態


ソフト404エラーの具体的な例

自分が保守しているサイトで
記事を削除されたり、非公開にすると
該当のページがありませんみたいなページを表示しています
例)

f:id:masalib:20150731140548j:plain

HTTPステータスは200を返しています
この状況は内容(コンテンツ)がない状態と同じです
エラーメッセージみたいな所は
404エラーを返すのがいいみたいです

ちなみにはてなBLOGの場合は
記事が削除されたり、非公開にすると
以下のようなページが表示されます

f:id:masalib:20150731140608j:plain


HTTPステータスは404になっています
なおHTTPステータスはデベロッパツールなどで確認できます

f:id:masalib:20150731140634j:plain


さすが!!はてなですね!!