アクセスログ解析で検索ワードが”無い”?

ウェブサイト作りで食い扶持を稼ぐ身。

作ったサイトのほとんどを置いているサーバも私の管理下にあるので、たまに「アクセスログの解析レポート作って」という依頼が来る。

大したものも作れないが(だから費用も控えめですけど)、アクセスログ解析ツールでの解析結果からめぼしい項目を抜き出してざっくりとしたレポートを作る。

で、そういう依頼が一年ぶりくらいにきた。
(そう、頻度としてはその程度。)

で、今はそのレポート作成をしているのだけど。
解析結果の検索ワードが少なすぎる。
いくらなんでも少なすぎる。

で、検索して考えて検索して。
「これは私にはどうにもできませんわ」という結論に至った経緯をメモ。

実は1年くらい前にレポート作成していた時(今回レポート作成しているお客さんではない)にすでに異変に気付いていた。
少なくとも会社名での検索数はそこそこあるお客さんなのに、それがほとんどなくなっている。
「バグ・・・?」
と思い、とりあえずその時は「後で調べますけど解析がおかしいので、代わりにGoogleサーチコンソール(旧名:ウェブマスターツール)のデータをどうぞ」で許してもらってた。

それを今まで放置していたわけですね(おい。

いい加減どうにかせねば、と思い、調べ始めた。

まず疑ったのは解析に使っているawstats。
でも、調べてもそれらしい情報は出てこない。
(ちょっと前のリリースだと「検索ワードの解析ができない」みたいなバグ?があったらしいが、自分がインストールしたリリースでは該当せず。)

ためしに別のログ解析ソフト(WebLog Expert Lite)でやってみることにする。
年初から使っているPCには入れていなかったので、インストールからスタート。サーバからログをDL(前処理として日別にしてたログファイルをawstatsのlogresolvemergeとやらを使って1か月分にまとめてみた)。
プロファイル定義して、ほい、解析~・・・って、やっぱり、少ない。

とにかく少ない。

ここで、やっと「そもそも検索キーワードがログに記録されてないのでは?」という可能性を考え始める。

その線で検索して、やっと事態を把握する。

その1:
SSLから非SSLへのリンクの場合、ブラウザはリファラーを送信しない(RFP2616)。

その2:
SSL化したGoogleで検索してリンクをクリックする時、いったんhttpにリダイレクトしてる。この時検索ワードが取り除かれ、結果「Googleから来ましたよ」というだけのリファラーが送信される。
https://webtan.impress.co.jp/e/2011/10/25/11417
※この記事の時点では「SSL化は現在はGoogleアカウントにログインしているユーザだけ」となっているが、今はログインしてなくてもSSLになってる。

その3:
Yahoo!の検索も、そうなった。
https://about.yahoo.co.jp/info/notice/150812.html

https://mieru-ca.com/blog/not-provided/
Yahoo!検索のSSL化は時間がかかっていたようで2016年9月頃から2016年12月頃にかけて進んできたものと思われます。

↑これ、自分が異変に気付いた時期にもちょうど合う。

なるほど・・・こんなことになっていたのか。(気づくの遅すぎ。)

というわけで、Googleサーチコンソール(登録しておいてよかった><)のデータを使うことにする。(過去3か月分しかデータが残ってない、というのがちょっと残念。)

まあ、「最悪awstast解析しなおす?」とか「インストールしなおす?(というかアップグレード必要?)」なんて考えていたので、それよりは・・・私としては良かったんだけど。

なんか、「使える情報」が検索エンジンに独り占めされちゃってる感がある。
「プライバシーの保護」をその理由にしているようだけど。
(一応Googleはサーチコンソールで情報を教えてはくれる。でも、”素”の情報じゃないのよね。これって、なんらかの意図をもって改ざん(というか一部情報を隠すとか)可能、っていう。。。何事も疑いだしたらキリがないし、「それがイヤなら検索エンジン使うなよ」って話になるけど。)

なんかね。
トランプ大統領の登場で「1984」が再度注目されてるというニュースがあったけど。
もしビッグブラザーが現れるとしたら、それは別のところにいる(というか、生まれつつある)、と私は思う。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA