- blogs:
- cles::blog
« 乗換案内 Yahoo!ロコ :: スコーンを焼いてみた »
2012/03/24

数値文字参照をデコードするワンライナー


先日、日本語が数値文字参照になってしまっている UTF-8 に戻す方法がないか尋ねられて、「これくらい気の利いたワンライナーでかけるはず・・・」と言ったものの、具体的なワンライナーが提示できずにちょっと悔しかったので、実際にワンライナーを書いてみました。こんな感じでしょうか。
† 動作テスト
$ cat test.xml | ruby -pe 'gsub(/&#(?:(\d*?)|(?:[xX]([0-9a-fA-F]{4})));/) { [$1.nil? ? $2.to_i(16) : $1.to_i].pack("U") }'
<?xml version="1.0" encoding="ISO-8859-1"?>
<root>てすと</root>
† テストデータ
test.xml
<?xml version="1.0" encoding="ISO-8859-1"?>
<root>てすと</root>
† 参考
トラックバックについて
Trackback URL:
お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]
このエントリへのTrackbackにはこのURLが必要です→https://blog.cles.jp/item/4850
Trackbacks
このエントリにトラックバックはありません
Comments
愛のあるツッコミをお気軽にどうぞ。[policy]
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
コメントはありません
Comments Form
コメントは承認後の表示となります。
OpenIDでログインすると、即時に公開されます。
OpenID を使ってログインすることができます。
« 乗換案内 Yahoo!ロコ :: スコーンを焼いてみた »
サイト内検索
検索ワードランキング
へぇが多いエントリ
閲覧数が多いエントリ
1 . アーロンチェアのポスチャーフィットを修理(112043)
2 . 福岡銀がデマの投稿者への刑事告訴を検討中(110672)
3 . 年次の人間ドックへ(110298)
4 . 2023 年分の確定申告完了!(1つめ)(109842)
5 . 三菱鉛筆がラミーを買収(109745)
2 . 福岡銀がデマの投稿者への刑事告訴を検討中(110672)
3 . 年次の人間ドックへ(110298)
4 . 2023 年分の確定申告完了!(1つめ)(109842)
5 . 三菱鉛筆がラミーを買収(109745)
cles::blogについて
Referrers