ブログの表示崩れを指摘するコメントスパム、検索してみたらすごい多かった

ブログにこんなコメントが。

“Hey just wanted to give you a quick heads up. The words in your article seem to be running off the screen in Chrome. I’m not sure if this is a format issue or something to do with web browser compatibility but I thought I’d post to let you know”

(訳) やあ、ちょっとお伝えしておこうと思うんだけど、Chromeで見ると文字が画面の外に流れて行ってるみたいだね。フォーマットの問題か、何かブラウザ互換性の問題かはわからないけど、知らせておこうと思って。

僕いつもChrome使ってるし、表示も全然崩れてないんですが。しかも日本語のブログにわざわざコメント? と思って書き込み者のところを見ると、英語で「背中の痛み.com」的なアドレスが書かれているわけで、リンク稼ぎのコメントスパムなわけです。

“Chromeで見ると”のところを抜いて“The words in your article seem to be running off the screen in”で検索すると、出るわ出るわ。

ネット中に100万件以上のコメントが、「やあ、このページはSafariだと文字が画面の外に…」「やあ、Internet Explorerだと…」「Firefoxだと…」「Operaだと…」と、ランダムにブラウザ名を入れ替えて、コメントフォームのあるあらゆる言語のあらゆるページに同じ書き込みが見つかりました。

この手の自動コメント投稿スパムは、ブログの本文について、何か感想を言っているようで実は何も言ってない、というのが特徴で、「やあ、すばらしい記事だね、感動したよ、その調子でがんばって!」みたいなのが多いのです。単純なプログラムで、本文の内容を解析してそれに合わせた自然なコメントを作るなんて、今は無理ですからね。SEOスパマーってのは楽をして手っ取り早く稼ごうとしている悪いやつらですから、そんなところは頑張らなくて、その自動コメントも、どんな記事に対してでも通用する文章しか使えないわけです。

しかし、ブログやサイトに関係なく通用する文章として、特定ブラウザでの表示の乱れとか、ブラウザ互換性を絡めてくるとはうまいな、と、変な方向で感心してしまいました。他のブラウザで崩れている、という指摘は無視しづらいものがありますし、一見親切なコメントに見えるため、たくさんコメントがついたり、コメントをあまり確認しなかったりするブロガーなら、消されずに残る確率は高まるでしょう。それで100万件もネットに残った結果、このスパマーが推している腰の痛み.com(リンク先ももちろんいろいろあります)が検索結果で上位に出てきてしまうわけです。

元カノのグーグル画像検索スパムによる復讐

これはひどい。元カレの名前で、元カレの写真にからかいや非難のフレーズを書き込んだ写真を大量生成し、グーグルでその名前を検索すると出てくるようにした元彼女というのがいたようです。

で、元カレのお母さんがグーグルのフォーラムで苦情を書いてたそうなんですが(もう消えてる)… ショックはわかるけど自分でやれよ元カレも。

via Girl Friend Gets Back At Ex-Boy Friend By Spamming Google Images

グーグル爆弾がオバマ大統領を直撃

“miserable failure”(みじめな失敗)というキーワードでジョージ・ブッシュ大統領の経歴ページにリンクを張ろうぜ、というSEOを活用したイタズラ(嫌がらせ)が何年も前からあって、これに代表されるリンクテキストを使ったおかしな検索結果を作ることを”Google bomb”(グーグル爆弾)といいます。

“miserable failure”→ブッシュ元大統領については、Googleが特別に対処したとかで起こらなくなったはずなのですが、検索エンジンのアルゴリズムなんてどこも似たようなもので、アメリカのヤフーで”miserable failure”を検索すると、なんとあの人のページが一位に出てきてしまいます。

オバマ大統領の就任式にあわせて、ホワイトハウスのサイトが完全リニューアルしたのですけど、リダイレクトの設定がよろしくないせいでこんなことに。元々このイタズラをしてた人たちの思惑とは違う結果なんじゃないかなー。

via Search Engine Land

関連

Google地図爆弾

はてなブックマークとURL中の日本語の取り扱いについての謎

うーん。

はてなブックマークでこのブログについたブックマークを見ようとすると、どうも変なことが起こってしまいます。ちょっと前から現象には気づいていたのですが、なにぶん個人ブログのほうはマイナーなブログだったので深く追ってませんでした。

このブログ(今日の名前は「(仮)アッキーニッキー」)では、WordPressの機能を使って、URLの最後には記事のタイトルをそのまま入れています。そのままといっても日本語なので、

%e6%9c%88....

みたいな、URLで使っていい文字だけで表した、いわゆるURLエンコードされた形式になっています。それで、ブラウザや検索エンジン等によっては、これがちゃんと元の日本語になって表示されたりします。

それで、akimoto.jp/blog/ 上ではそれらのURL EncodedなURLは、元々は上のように、AからFまでが小文字になっています。

がしかし、たとえば、こないだのエントリ(仮)秋元ブログ � 2月から「部分的に」フリーになりましたについてのはてブを調べようとすると、なんだかおかしなことが起こっているのです。

はてブakimoto.jp の新着エントリー

このように、同じエントリに対して二つの情報が。

それぞれのリンク先を開くとわかるのですが、一方は%e6%9c…とアルファベットが小文字なのに、もう一方は%E6%9C…と大文字になっています。

14 usersと11 usersのうちわけを見ようとすると、14のほう11のほうも、14人のブックマークが表示されます。

実際のブックマークは14なのか、11なのか、ということで、新着ブックマークのほうで一件ずつを見てみると、

はてブakimoto.jp の新着ブックマーク

さっきの14usersで出てこないブックマークが個別には存在することがわかります。新着ブックマークを見ないと、これらのブックマークが存在したことにも気づかなかったでしょう。

どうやら、ページに対するブックマークは25個あるようなのですが、アルファベットの大文字と小文字にわかれて、別々にカウントされているようです。

はてなブックマーク側がアルファベットの大小を正規化してくれればいいのですが、何かそうできない事情があるのかもしれません。

あとは、小文字でURLを出しているはずなのに、どうしてアルファベット大文字でブックマークしてくれた人が半分も存在するのか、ですね。

本来の小文字アルファベットでブックマークしてくれたはてなユーザ

  • zee8
  • Ubuntu
  • naoya_nakazawa
  • yuseki
  • n_maco2
  • shimooka
  • kmachu
  • youpy
  • higepon
  • kwmr

本来の大文字アルファベットでブックマークしてくれたはてなユーザ(一覧で見えるユーザ)

  • hogshead
  • nak2k
  • hamasta
  • tsupo
  • otsune
  • markup
  • hirok73
  • T-norf
  • nkoz
  • sankaseki
  • juniper
  • iskwrsk
  • netafull
  • TAKESAKO

この二群の違いが、OSか、ブラウザか、何を使って(ブックマークレットとかツールバーとか、他のSocial Bookmarkからのスクリプトによるインポートとか)ブックマークしているか、に違いがあるのでは、と思っているのですが、どうなんでしょう?

# WordPressが悪さをしていて、特定のリンクから見に行くとそこだけアルファベット大文字のURLになっている、という可能性もありますかね。ちょっと見たところではそういうのはないけど。

なんにしても、同じエントリをブックマークしている人がまとめて見えないのでは、ソーシャルサービスの価値が減じてしまいますね。こちらで直せるような問題ならなんとかしたいところです。

逆に、これが解消できない問題だったときは、これを活用することで、はてなブックマークでブックマークされても話題になりにくいページを作る、というのもできるかもしれませんね。AからFのアルファベットが入っている箇所を、大文字小文字変換していくと、アルファベットをビットにしただけ、ブックマーカを分断することができそうです。

[追記]

現象は前から問題提起されていたみたいです。とりあえずWordPressが相手に応じて(大文字小文字だけ)違うURLを出しているわけではなさそうです。

ただ、上の記事の続きの記事を読むと、RFC3986で正規化は大文字のほうへ、とあるので、小文字で表示するWordPressも褒められたものではない、ということですか。

こちらでできるのは、ブックマーク数が半減するけどこのまま続けるか、URLに日本語を書くのをやめるか、WordPressを直す、になるのかな。ちょっとソース見てみることにします。

新ブログ名選考中

おもにはてなブックマーク経由で、いろいろとアイデアをいただきました。ありがとうございます。

  • 今日のアッキーさん
  • アルファブロガーのネタ帳
  • shut the f*ck up and write some blog
  • ブログってなぁに?
  • スパモン・ヌードル
  • 空飛ぶネットイナゴ
  • AKB404
  • ストップウォッチ一世
  • AA-VIPPER
  • たとえば炎上を避ける

id:TAKESAKOさん。細かいネタだらけw いろんなところに波紋を起こしそうな名前が多いです。

  • 秋元ちゃん

コグレさん。いっそ「秋元©」とか?

  • 元秋元
  • akimoto
  • 秋友
  • マルトモ

memo…というかid:MinoruArakiさん。一番目の発想はなかった。元じゃないけど。実は2番目はいいかもしれないですね。せっかくのドメイン名なんだし。

  • 秋元千晶ブログ

麻生千晶ブログ、というブログ名は本当に秀逸だと思います。目標がどこにあるかはともかくSEO的にも。「お前も千晶組に入るんや!」みたいな

  • AkiMode
  • Archi Technica
  • イチゴニュース
  • 秋元PHP化計画

shomaさん。どれもどっかで見たようなw。3番目のイチゴはいったいどこから…

Web担当者 現場のノウハウ認定「SEOのプロ」としては(冗談ですよ。SEOを商売にしたことはないのでアマチュアのはず)、ブログ名をキーワード入りにしておくと、本文で何にもそれについて書いてないのにそのキーワードでやたら表示されるようになる、という戦略は見逃せませんね。

[am]4844325132[/am]

たとえば、日本には有名な404 not foundの権威がいらっしゃいますね。僕はといえば、いつまでたっても康(リンクは割愛w)に追いつくことができません。

これを機に広告料が高いキーワードを散りばめたりして。

  • 秋元@保険ローン不動産ブログ

とか。これはひどいw