2008年11月
« 10月   1月 »
 12
3456789
10111213141516
17181920212223
24252627282930

カテゴリー

WWW::Mechanizeで日本語を含むURLを操作するときの注意点

だめな書き方

page = agent.get(“http://hoge.net/?c=ああああ”)
page = agent.get(“http://hoge.net/?c=#{CGI.escape(‘ああああ’)}”)

正しくは
uri URI.parse(“http://hoge.net/?c=#{CGI.escape(‘ああああ’)}”)
page = agent.get(uri)

理由は、urlに文字列を渡すとWWW::Mechanize内部で変換をしている箇所があり、そこで変な変換結果になってしまうことがあるため。

Hikiの(むりやり)UTF-8化

hikiのutf-8化
hikiは、rubyで書かれたwikiで、DBを必要としないため簡単に利用できるのがうれしい点。
ただし、現在のバージョン(0.8.7)ではUTF-8に対応していないため、UTF-8を使用すると自分で何とかする必要がある。
以下は、何とかしたときの作業ログです。
あまり推奨できるやり方では無いと思いますが、メモとして残しておきます。
前提
まっさらなところに新たにhikiをインストールするものとします。
すでにhikiを運用している場合にそのデータをUTF-8に対応させるのは本稿の対象外とします。
まずはダウンロード。
wget http://globalbase.dl.sourceforge.jp/hiki/25954/hiki-0.8.7.tar.gz
tar xvzf hiki-0.8.7.tar.gz
できたフォルダで、以下を実行して強制的にUTF-8に変換を実施
find . -name ‘*.rb’ | xargs nkf –overwrite -w;
find . -name ‘*.css’ | xargs nkf –overwrite -w;
find . -name ‘*.conf’ | xargs nkf –overwrite -w;
find . -name ‘*.cgi’ | xargs nkf –overwrite -w;
find . -name ‘*.html’ | xargs nkf –overwrite -w;
find . -name ‘*.rhtml’ | xargs nkf –overwrite -w;
つぎに、ダウンロードしたものにたいしgrepでEUC-JPと表示されている部分を
片っ端からUTF-8に置き換える。
ページタイトルをEUCで保存している処理が/hiki/command.rbにあるので、そこを修正
(おそらくこれでUTF8以外で利用できなくなっちゃってる?)
diff -r [...]

vimで文字コードを指定してファイルを開きなおす

あまり使わないからちょっとやりたいなと思ったときに忘れていつもググってる。
この際だからいい加減に覚えようと思う。
それぞれの文字コードで開きなおす方法
:e ++enc=utf-8
:e ++enc=sjis
:e ++enc=euc_jp

2ちゃんねるはなぜ潰れないのか?

読書メモ

孫正義はすごい人
→ 既に無茶しなくていいポジションでも、絶対守りに入らない。
GyaoはYoutubeさえなければきっと成功していた
成功しているCGMの典型例は、「出会い系サイト」(場を提供する会社にユーザがお金を払うしくみ)
セカンドライフは”つまらない”という確認をすることが大変
→ つまらなさを認識させない複雑さ
みんなが間違った考えで行動するときは、頭のいい人が頭の悪い人をだましている。
→ 公共性はみんなが考えることなので、みんなが間違うとどうしようもない。
法律では、日本の公道で100km以上のスピードは出せない。なのに100km以上のスピードが出る車が売られている。
日本は妙なバランスの国で、法が絶対ではない。
ひろゆき×子飼弾の対談は特に面白かった。

2ちゃんねるはなぜ潰れないのか? (扶桑社新書 14)
posted with amazlet at 08.11.03

西村 博之 扶桑社 売り上げランキング: 11550

おすすめ度の平均:
鯔 頭の良 ウエッブ進化論を読んだなら、こっちも読まなきゃ! 身も蓋もなさすぎてついていけない内容にご注意! 一識者の声
Amazon.co.jp で詳細を見る