とりあえずプライベートがちょっと落ち着きを取り戻してきたので、ぼちぼち作業を再開していこうかなと思います。いちおうタスクリストはこんな感じ。
† NP_Blacklist関連
まず表示の日本語化。これは必須。本に入れる入れないという話が出ているので、入れるんだったら是非とも日本語化しておかないと!本当は正規表現のレクチャーとかもかければいいのかもしれないんですが、そこまでは難しいかも。
あと、NP_Akismetなどの他のAnti-spam系のプラグインと共存できるための仕組みの導入はやっておきたい。
ログ周りのメンテが大変というのも見かけるので、一定以上のログは勝手に切り捨てるという機能をつければメンテナンスフリーということになるんでしょうか。
† NP_HatenaAuth公開とNP_TypeKeyのアップデート
NP_HatenaAuthはとりあえずドキュメントをwikiにあげればOK。それに伴ってNP_TypeKeyもNP_HatenaAuthとの共用を考慮しているバージョンにアップデート予定。
sharedlibsディレクトリがどんどん肥大化していってるのはちょっと心配。
† NP_Trackback関連
しづきさんの確かローカルトラックバック関連のやつとURL生成関連のやつ。あと、藤咲さんリクエストのspam判定時のTB無視設定。いちおう認識してるのは上記のみ。
それ以外にもあったような気がするんですが、あとは未読の山になっているフォーラムをやっつけるしかないですね。
† コアの実装の調査
これは優先度低めですが、Nucleusを高速化/低負荷化のためにmysqlから取り出したデータについてmemcachedを使うようにコア改造してるんですが、やってて気づいたのは管理画面のリクエストを受け取って処理を行うADMIN.phpがけっこうヒドいことなってるなぁということ。
ADMIN.phpはあくまでFacadeの位置づけだと思っていたので、action_hogehoge()の実質的な処理は他のクラスに委譲されるべきだと思うんですが、そうではなく自前でsql発行してDB書き換えしてたりする部分があります。そのせいで各クラスに実装しておいたキャッシュクリアのルーチンが呼ばれずにヒドイ目に会いました。まぁ、そういうところがちょっとでも書き換えられればいいかなと。
† NP_SpamBayes JP
mecabが使えるサーバ限定なので、ほぼ自宅or専用サーバ専用になっちゃうのですが一応公開だけはしておいたほうがいいのかな。
† NP_TrimImage 2007/1/22追記
バグFix版のリリースと、<img>タグ対応。
NP_SpamBayesJP、対象テキストを簡易的に英数・カナ・かな・漢字で切る手なんてどうでしょうか。
思いつきなので精度がどこまで出るかはわからないですが。
どもです
ローカルトラックバックの件ですが、NP_CustomURL側で、/item_23.html を ?action=plugin&name=TrackBack&tb_id=23 に変換して、$_REQUEST['trackback_ping_url'] を再構築して返してやる事で対応させてみようとか思ってるんですが、どんなもんでしょう?
PostAdd/UpdateItemの処理が、CustomURL の方が先に来ると思うんで、上手く言ってると思うんですが…
それとURL生成は、debug_backtrace() 使うことでとりあえず大丈夫なようです
php のバージョンが4.3.0以降に限定されますが、これは mysql_real_escape_string() も同じなので大丈夫かなと思います
あと、エンティティ化は無駄っぽいんで、katsumiさんのプラグインみたく、javascriptで書き出す方式はどうでしょう?
一番気になってるのは、livedoorブログで採用されてる、『link.cgi』なんです
こういうワンクッションおく言及リンクの場合リンクが検出されないようなので、これに対応してもらえたらと思います
mecabのwebサービス、あるにはあるんですけどねぇ…
yuさん
NP_SpamBayesJP、対象テキストを簡易的に英数・カナ・かな・漢字で切る手なんてどうでしょうか。
単語の出現頻度を判定基準にするので、文章の書き方によって単語の切れ方が違うようだと、出現頻度がうまく計算されない可能性はありますが、試してみる価値はありますね。
# 割り切ってオリジナルをそのまま使うほうが認識率が高いかも知れません。
shizukiさん
ローカルトラックバックの件ですが、NP_CustomURL側で、/item_23.html を ?action=plugin&name=TrackBack&tb_id=23 に変換して、$_REQUEST['trackback_ping_url'] を再構築して返してやる事で対応させてみようとか思ってるんですが、どんなもんでしょう?
そうですね。これは行けそうな感じがします。
エンティティ化は無駄っぽいんで、katsumiさんのプラグインみたく、javascriptで書き出す方式はどうでしょう?
正直、ちょっと悩みどころですね。あまりTrackbackを肥大化させすぎるのにちょっと抵抗があるのと、spammerの挙動はコロコロ変わるので、katsumiさんのプラグインで対応できるのであれば、Trackback側で対応するんじゃなくてそちらを使ってもらう方が機動力的には高いような気がします。
一番気になってるのは、livedoorブログで採用されてる、『link.cgi』なんです
現在のルーチンは結構strictな判定(完全一致のみをリンクと認識)をしてますからね。
livedoorのためだけのコードを実装するのはなんか変な気がしますし、実際にlink.cgiを叩いてHTTP Headerなり、HTMLを解析する手はあるんですが、双方にとってちょっと負荷がきついののでこれは流石にまずいのでこれもダメですね。
現実的な線としては、リンクの文字列をURLデコードしてquery内も含めて部分一致にするというのが無難な妥協点でしょうか。livedoorのようなクエリにURLを渡すような単純なリダイレクタはであれば十分かなと思います。
katsumiさんのプラグインで対応できるのであれば、Trackback側で対応するんじゃなくてそちらを使ってもらう方が機動力的には高いような気がします。
なるほど、それもそうですね
query内も含めて部分一致にするというのが無難な妥協点でしょうか。
今livedoorからの実験をとりあえず受け取る為に、まさにその通りのコードかいてたりします
http://shizuki.kinezumi.net...
ああいう方式採ってるのって、今のところlivedoorだけなんでしょうか?
もしlivedoorだけだったら、この件は採用するところが増えてから検討という形で ^^;
ややこしいこと言ってすみません
今livedoorからの実験をとりあえず受け取る為に、まさにその通りのコードかいてたりします
うぉ。見落としてました。。。。というか、どっかで見たような気がしてたんですが、やっぱりshizukiさんのところでしたか。
たびたびお邪魔します
たった今思い出したことが ^^;
トラックバック受信通知のメールを、ブログ毎に設定出来るようにしていただけるとありがたいです <(_ _)>
わかりました。導入しましょう!
# 自分はトラックバック受信通知のメールはほとんど使っていないので、このあたりの需要が良くわからないんです。。。。。
コメントは承認後の表示となります。
OpenIDでログインすると、即時に公開されます。