今日のToDoを宣言してみよう

半フリー2日目。「週休4日の会社員」になってはじめての自宅作業日は、単に有給取った日とあまり違う感じがありませんでした。

「一人で仕事をすると、自分を律するのが難しいよ」、と昨日助言されたんですけど、もともとやるべきことをきっちりやれない自分としては、そのあたり大いに不安です。

そこで、実験的に、今日はやるべき作業をブログに書いてみることにします。

  • Asiajinで記事を一本書く
  • はてなブックマークとURL中の日本語の取り扱いについての謎の、WordPress側の問題について、WordPressのバグデータベースとメーリングリストの調査
  • WordPress+日本語URLエンコーディング問題の解決
  • project nのsitemaps対応
  • 某hostingでgmailからのメールをスクリプトからpopで読めない件の調査
  • 確定申告のためのレシート分類と整理
  • 夜はとあるネットサービスの発表会に参加する

これぐらいかな。新Vistaマシンにメインを移行、っていう懸案事項があるんですが、それやるとまた何かはまって時間をつぶしてしまいそうで怖い。

AA-Camp#7開催中

今日は、半分フリー(いわゆるハンフリー)になって初めて、実際にフリーな日となりました。そこで、開発会議AA-Campの7回目を開催することに。

twitterでつぶやいたりしてみましたが、告知が急だったのと、さすがに平日ということで朝から一人で作業していました。あまり会社に行ってるときと変わりません。

夕方から、実は日本で24番目にアクセスされるサイトを持っていたことが読売新聞に報じられたサイドフィードの赤松さんが来てくれました。トラックワードってそんなに貼られてるのかあ。

夜は会社終わってからの人がもう一人ぐらい来るかも。

はてなブックマークとURL中の日本語の取り扱いについての謎

うーん。

はてなブックマークでこのブログについたブックマークを見ようとすると、どうも変なことが起こってしまいます。ちょっと前から現象には気づいていたのですが、なにぶん個人ブログのほうはマイナーなブログだったので深く追ってませんでした。

このブログ(今日の名前は「(仮)アッキーニッキー」)では、WordPressの機能を使って、URLの最後には記事のタイトルをそのまま入れています。そのままといっても日本語なので、

%e6%9c%88....

みたいな、URLで使っていい文字だけで表した、いわゆるURLエンコードされた形式になっています。それで、ブラウザや検索エンジン等によっては、これがちゃんと元の日本語になって表示されたりします。

それで、akimoto.jp/blog/ 上ではそれらのURL EncodedなURLは、元々は上のように、AからFまでが小文字になっています。

がしかし、たとえば、こないだのエントリ(仮)秋元ブログ � 2月から「部分的に」フリーになりましたについてのはてブを調べようとすると、なんだかおかしなことが起こっているのです。

はてブakimoto.jp の新着エントリー

このように、同じエントリに対して二つの情報が。

それぞれのリンク先を開くとわかるのですが、一方は%e6%9c…とアルファベットが小文字なのに、もう一方は%E6%9C…と大文字になっています。

14 usersと11 usersのうちわけを見ようとすると、14のほう11のほうも、14人のブックマークが表示されます。

実際のブックマークは14なのか、11なのか、ということで、新着ブックマークのほうで一件ずつを見てみると、

はてブakimoto.jp の新着ブックマーク

さっきの14usersで出てこないブックマークが個別には存在することがわかります。新着ブックマークを見ないと、これらのブックマークが存在したことにも気づかなかったでしょう。

どうやら、ページに対するブックマークは25個あるようなのですが、アルファベットの大文字と小文字にわかれて、別々にカウントされているようです。

はてなブックマーク側がアルファベットの大小を正規化してくれればいいのですが、何かそうできない事情があるのかもしれません。

あとは、小文字でURLを出しているはずなのに、どうしてアルファベット大文字でブックマークしてくれた人が半分も存在するのか、ですね。

本来の小文字アルファベットでブックマークしてくれたはてなユーザ

  • zee8
  • Ubuntu
  • naoya_nakazawa
  • yuseki
  • n_maco2
  • shimooka
  • kmachu
  • youpy
  • higepon
  • kwmr

本来の大文字アルファベットでブックマークしてくれたはてなユーザ(一覧で見えるユーザ)

  • hogshead
  • nak2k
  • hamasta
  • tsupo
  • otsune
  • markup
  • hirok73
  • T-norf
  • nkoz
  • sankaseki
  • juniper
  • iskwrsk
  • netafull
  • TAKESAKO

この二群の違いが、OSか、ブラウザか、何を使って(ブックマークレットとかツールバーとか、他のSocial Bookmarkからのスクリプトによるインポートとか)ブックマークしているか、に違いがあるのでは、と思っているのですが、どうなんでしょう?

# WordPressが悪さをしていて、特定のリンクから見に行くとそこだけアルファベット大文字のURLになっている、という可能性もありますかね。ちょっと見たところではそういうのはないけど。

なんにしても、同じエントリをブックマークしている人がまとめて見えないのでは、ソーシャルサービスの価値が減じてしまいますね。こちらで直せるような問題ならなんとかしたいところです。

逆に、これが解消できない問題だったときは、これを活用することで、はてなブックマークでブックマークされても話題になりにくいページを作る、というのもできるかもしれませんね。AからFのアルファベットが入っている箇所を、大文字小文字変換していくと、アルファベットをビットにしただけ、ブックマーカを分断することができそうです。

[追記]

現象は前から問題提起されていたみたいです。とりあえずWordPressが相手に応じて(大文字小文字だけ)違うURLを出しているわけではなさそうです。

ただ、上の記事の続きの記事を読むと、RFC3986で正規化は大文字のほうへ、とあるので、小文字で表示するWordPressも褒められたものではない、ということですか。

こちらでできるのは、ブックマーク数が半減するけどこのまま続けるか、URLに日本語を書くのをやめるか、WordPressを直す、になるのかな。ちょっとソース見てみることにします。

公開型SNSと証拠能力

15歳の娘の拒食症の保険申請を却下するために保険会社がfacebookの書き込みを証拠としようとしている話、なんていうのを読んだ。肉体的な病気はこの保険の対象だけど、精神的なものは対象外で、その証拠としてウェブでの書き込みを探してきたとか。アメリカの保険調査員は(顧客にとっては嫌な意味で)優秀だなあ、と思いつつ、ネット上のどんな活動が後々の証拠として持ち出されるかわからない時代になってきたのだなあ、と思いました。

元気がなかった、とか異常な書き込みがあった、ということが自分の不利になるだけではなく、元気で活動していた、というのが自分にとって不利な証拠になる可能性もあるわけで、何が自分の不利になるかは、事件が起こってみないとわからない。でも、それを心配してネットの活動を変えるというのも、問題が起こりうる可能性を考えると杞憂に近いわけですし。

記事中の”internet is not like a diary”(インターネットは日記ではない)は、日本でいう「チラシの裏にでも書いておけ」に対応するのかもしれません。僕は紹介さえあればどこまでも広まっていく今のネットやブログを利用してきた方だし、今までのところはそれを快適に思っていますが、枠の外に一歩踏み出すとその先はいきなり全世界に通じている、というところに、何か仕組みで段階を増やすようなことはできるんでしょうかねえ。Mixi発の炎上のように、枠の中に居ても人力で書き込みが枠を越えてしまうこともあるわけだし。

今日のtwitterスパム

ユーザ名==ドメイン名、というtwitterユーザからfollowされました。「どれどれ」とサイトを見に行くことを期待しているようですね。もちろん無視です。

知らない人から勝手にメッセージを送られない(というか、送られても見ないので気づかない)というのは、eメールよりもだいぶマシですけど、followという行為自体がスパムに使われるとねえ、どう防いでいいものか。