- blogs:
- cles::blog
Yahoo!のAPIで特徴語抽出が可能に
nlp
YahooAPI Yahoo!のテキスト解析APIにテキストからの特徴語を抽出する機能が追加されたようです。
Yahoo!デベロッパーネットワーク - テキスト解析 - キーフレーズ抽出
日本語文を解析し、特徴的な表現(キーフレーズ)を抽出します。
これまでNP_MetaTagsの特徴語抽出は、Yahoo!の形態素解析の結果を自前でTF-IDFを使って処理していましたが、このAPIを使えば一撃で特徴語を抽出することができるようになります。特徴語は重要度が高い順に最大20個とれるようです。特徴語はドキュメントの母集団によって抽出される語が変化しますが、一般的な特徴語を抽出したい場合にはこのAPIは手軽に使えるのでいいですね。
Amazon Product Advertising APIの署名認証ルーチンを書いてみた
amazon
php Amazon APIの認証方法が変更になって、8月からはリクエストへの署名認証が必須になるらしいので、NP_Amazonが使えなくならないようにphp用の認証ルーチンを書いてみました。まぁ、同じものを開発しているひとはたくさんいるのでしょうけど。
書いてみると、思っていたよりもシンプルですね。
Sonarでコードの品質をレビュー
java
programming ソースコードの品質ををチェックするツールというのはCheck StyleやPMD、FindBugsなどがありますが、これらをソースコードに適用して結果をグラフィカルに表示するSonarというツールを見つけました。
Code quality management platform
Sonar enables to collect, analyze and report metrics on source code. Sonar not only offers consolidated reporting on and across projects throughout time, but it becomes the central place to manage code quality
ソースコードをビルドするときにMaven使わないといけないのがネックになるかもしれませんが、逆に言えば必要なことはMavenが全部やってくれるのでビルドした後はSonarサーバにアクセスしてレポートを確認することができます。チェック内容についてはサーバー上で変更や確認ができるようになっています。
サーバは複数のプロジェクトを管理することができるので、こんな感じでプロジェクト間の比較ができるというのもなかなか便利です。
XML-RPCを使ってTracのチケットに添付ファイルを投げ込む(Perl編)
trac
perl 仕事場に導入したTracはかなり活用されてきていて、導入した自分としては嬉しい限りです。僕はコンソール作業の記録をしばしばTracに転記しているのですが、そうするとコンソールとウェブブラウザを行ったり来たりしなければならないので、それがちょっと面倒になってきました。
ということで、ブラウザを開かずに、Linux上のコンソールのコマンドで特定のチケットに添付ファイルを投げ込むスクリプトを書いてみました。Tracには他のシステムと連携するためにXML-RPCというインタフェイスが用意されているので、これをPerlから叩いてみます。XML-RPCについてはNucleus関連の開発でも散々いじったので自分としてはPHPで書くのが一番得意なのですが、今回はPerlで開発することにします。
[XML-RPCを使ってTracのチケットに添付ファイルを投げ込む(Perl編) の続きを読む]
コピペブログは犯罪
dishonesty
copyright 総務省の調査で12%のブログはスパムという話もあり、そういうブログは人のサイトのエントリをコピペしているだけだったりするわけですが、そんなコピペブログで逮捕者が出たというニュースがちょっと前にあったのでメモ。
Blog に記事を無断で転載、男性を逮捕――ACCS が報告 - japan.internet.com Webビジネス
男性は、2008年7月23日ごろから2009年1月13日ごろまでの間163回にわたり、Web サイト「goo ヘルスケア」に掲載された法研が著作権を有する文章を、無断で自らが開設する Blog に掲載して不特定多数のインターネットユーザーに対して自動的に送信できる状態にし、同社の著作権(公衆送信権)を侵害していた。
おそらくこういう事例は初めてですよね。ニュースの内容だけでは詳しくはわかりませんが、サイトの内容を引用の範囲を超えてコピペして掲載していたということなんでしょうか。しかしこれは公衆送信権の侵害になるのか・・・・ダウンロード違法化になった掲載した人だけじゃなくて見た人も犯罪ということになったりしないのかなぁ。
Solrに入門してみる
fulltextsearch
java
programming
solr 最近、大量のテキストデータを扱う事が多いのでSolrという全文検索サーバをいろいろと調べています。
とりあえず、情報が纏まっているページがあったので助かりました。
全文検索サーバ: これからSolrを始める人のためのApache Solr概要と便利なリンク集 | イージーネット Tech Blog
GoogleでSolrを検索しても、日本語圏のコンテンツはまだまだ少ないようです。
当社がSolrを使い始めた昨年は現在よりもさらに少なく、結構苦労しました。
今回はやや雑多な内容となりますが、新しくSolrを使う際に必要と考えられる情報をまとめてみました。
今から4,5年くらい前に開発でLuceneを軽くさわった事があったのですが、資料は英語ばっかりで到底自分の手に負えるような代物ではなく、自分はネイティブなエンジニアがLucene in Actionを開きながら説明してくれる情報に耳を傾けるだけという状況だったことを考えると、今やSolrという全文検索サービスとして使えるアプリケーションが手に入る時代になったわけですからだいぶ時間が経ったなぁという気がします。
白碗竹快樓
chinese 今日は久々に赤坂でランチ。白碗竹快樓という、ちょっと変わった中華料理のお店に行ってきました。ここは古い一軒家を改造して作ってあるらしく、外観からはとてもじゃないですが、中華料理のお店にみえません。
写真は定番の麻婆豆腐(\1,200)。リーズナブルな価格なものが多い赤坂のランチではちょっと高めですが、花椒が効いた麻婆豆腐は食が細くなってくる夏の時期にこそ食べたい味です。が、食べ終わるとしばらく汗が止まりませんでした。
[白碗竹快樓 の続きを読む]
マスク特需と楽天
rakuten 楽天がマスクの販売を煽ったことが問題になっているみたいです。そもそもは政府のミスリードが原因なので、いろいろと仕方ないかなと思うと同時に、今頃こんなことが問題になるなんてと思っています。文面から察するに、おそらく楽天のECコンサルタントが送ってくれるメールなのだろうと思います。
楽天が店舗に送ったサポートメールとして一部報道では、「ここ何日かでマスクを売っている店舗様は、なんと日商1000万円以上売れているそうです。日商5000円以下の店舗様が600万円以上売ったとか。そんな店舗様がゴロゴロ、すごいですね」などの文面を紹介している。
普通の人は店舗側の楽天の仕組みをよく知らないと思うのでちょっと補足しておくと、楽天では導入が完了すると自社の販売に対してアドバイスをくれるECコンサルタントと呼ばれる人がつきます。ECコンサルタントは例えば、食品、家電のような商品のカテゴリと店舗が所属する地区ごとに担当がいて、自分が担当するショップの動向を常にウォッチしています。急に売上が伸びた店舗を見つければ、その店舗とケースを分析して、他店にメールの出し方、季節の売れ筋、広告の出し方などの売り方にかかわる成功事例を横展開したりします。このメールもその一環で、内容がマスクなので問題になっていますが、楽天に出店していれば食品でも家電でもこういうメールはしょっちゅう送られてきます。
[マスク特需と楽天 の続きを読む]
IE8が自動更新に
msie 3月に正式版が公開になったIE8ですが、今週からWindows Updateで配布が開始されるようです。
これでIE8も一気に普及してくるでしょうから、自社のサイトやウェブアプリケーションやIE8での動作確認はきちんと行っておいた方が良さそうです。
窓の杜 - 【NEWS】「Internet Explorer 8」の日本における自動更新が今週より正式に開始
Microsoft Corporationは、同社製Webブラウザー「Internet Explorer 8」(以下、IE8)の日本国内における自動更新を、今週より開始すると発表した。
社内ポリシーや、開発用マシン等の理由で自動的に更新されたくない場合は、ダウンロードの詳細 : 自動配布の無効化ツールキットをインストールしておくと良さそうです。
エイヤーは業界用語?
言葉 エイヤーは普通に使っていたんですが、業界用語という記事が載っていたのでちょっとびっくり。
そういえば、以前もサチるとかネグるというのが業界用語という話がありましたね。
製造業界で飛び交う、【ピアス】や【エイヤー】という言葉。これは、アクセサリーでもなければ掛け声でもない。今回は、この言葉の種明かしも交えつつ、「業界用語」アレコレを集めてみた。
僕はエイヤーは概算で、山勘で、どんぶり勘定で、ざっくりとみたいな感じで使っていました。ガリガリとかコツコツの対義語みたいな感じです。具体的には下記のような感じ。
「この件の開発工数ってどれくらい?」
「ちょっとすぐには・・・・」
「まだ本決まりじゃないから、エイヤーで工数感が知りたいんだけど」
「うーん、5~8MMくらいですかね」
ちなみに、上記の記事に載っているピッキングは製薬だけでなく、流通でも倉庫の商品の棚出しをそう呼んでいると思います。
- 換気口に風よけカバーを設置 (2)
2 . 福岡銀がデマの投稿者への刑事告訴を検討中(1435)
3 . シャープの空気清浄加湿器のキュルキュル音対策は PTFE テープで(1306)
4 . GitHub が全ての公開リポジトリへのシークレットスキャンを有効に(1160)
5 . 年次の人間ドックへ(1115)
Academic[574]
Book[155]
Diary[522]
Disaster[101]
Foodlogue[1425]
Game[284]
Goods[805]
Healthcare[341]
Hobby[32]
IT[1195]
Military[343]
misc.[1570]
Mobile[510]
Music[38]
Neta[106]
News[95]
Photo[391]
RealEstate[120]
Security[1178]
SEO Contest[36]
Software[634]
Tips[1886]
Travelogue[1238]
Web[675]
Work[193]


