- blogs:
- cles::blog
Google が AI によるファイル判別ツールをリリース
google
cli
python Google が AI によってファイルを判別するプログラム Magika*1*2を公開していました*3。
通常、Linux で拡張子がない不明なファイルの詳細を知りたい場合には、ほとんどの人はfile*4 コマンドを使うことが多いと思います。ただし、ファイルがどのアプリケーションによって作成されたものなのかを判定するための一般的な方法はないため、file コマンドを使ったとしても内容が正しく判別されるとは限りません。file コマンドの場合には、ファイルの判定はファイルシステムテスト(ファイルが空か?特殊ファイルか?)、マジックナンバーテスト(ファイルの先頭にマジックナンバーが記載されているか?)、言語テスト(ファイルがテキストである場合には、どのような文字コードで書かれているか)の 3 つの判定が順に行われるとされています。つまり基本的にはヒューリスティックなルールを一定の順序で試してみて、該当するものがあるかどうかを判定していることになります。
これに対して、Magika は人間が作ったルールではなく、これをディープラーニングによるモデルで代替しようという試みです。
Googleが高精度かつ高速にファイル形式を判別するツール「Magika」公開 - PC Watch
Magikaはディープラーニングの力を活用し、平均精度99%以上を実現しつつ、1つのCPUで実行しても1秒間に120種類以上/数百万ファイルのファイル形式を判別できるツール。判別時間はわずか数ミリ秒で、モデル自体も比較的小さく、コアモデルは1MB未満だ。
† インストールは pip で
イントールは Python 環境があれば pip で一撃なので簡単に試してみることができます。
- *1: Magika
- *2: GitHub - google/magika: Detect file content types with deep learning
- *3: Magika: AI powered fast and efficient file type identification | Google Open Source Blog
- *4: Ubuntu Manpage: file - ファイルタイプを判定する
Google が検索結果からキャッシュへのリンクを削除
google
eol Google の検索結果には Googlebot がサイトをクロールしたときのキャッシュへのリンクが含まれていましたが、これがひっそりと削除されたようです。
サイトが落ちているけど内容をちょっと確認したい・・・みたいな時に便利だったんですが、まぁ使用頻度がそれほど高くない機能だったのでしょうがないという感じでしょうか。
Google検索のキャッシュリンクが廃止で過去のページが閲覧不可に - PC Watch
これまで検索結果の各Webページのキャッシュにアクセスできるリンクが用意されており、Webページの過去の状態や削除される前の状態などが確認できたが、このリンクが削除されたかたち。検索演算子「cache:」を使ったアクセスはまだ行なえるが、将来的にはこちらも利用できなくなる予定だという。
神奈川の入試ネット出願システムの不具合が復旧
google 神奈川の入試ネット出願システムで Gmail での受信が正常にできない現象が発生していた件が、やっと解決したようなのでメモ。
こういう Google や Yahoo 等のフリーメールのサービスは日々 spam との戦を繰り広げているので、予告無しかつ不定期にフィルタリングのルールが変更されることがあり、メールが届かないと言われる送信側のシステム管理者にとっては常に頭痛の種です。Google は昨年、Gmail へのメール配信を行う場合のガイドラインを公表していて、実施が 2 月からに迫っていましたが、これとは関連関係ないはずです。
自分でメール配信するサービスを作るときには SendGrid などのサービスを使うというのが現在のベストプラクティスだとは思っています。
神奈川県公立高等学校入学者選抜インターネット出願システムの稼動状況について - 神奈川県ホームページ
令和6年1月10日掲載(第1報)
本システムからのメールの受信をする際、Gmailでの受信が正常にできない現象が発生しており、現在原因を調査中です。
Gmailを利用されている方は、Gmail以外のメールアドレスの利用をご検討ください。
利用者の皆様にはご迷惑をおかけして大変申し訳ございませんが、ご理解とご協力の程よろしくお願いいたします。
ロージナ茶房
tokyo
cafe
curry 仕事で久しぶりに中央線で西の方に来たので、国立によって旧友とロージナ茶房で晩飯。
店内のレトロな雰囲気にちょっと驚きましたが 1954 年創業ということで納得。近くに一橋大学があるので、店内は学生さんと思しき若い人で一杯です。石原慎太郎が学生時代に通っていたという名店のようです。
名物のザイカレーとビーフストロガノフを注文してみましたが、レトロな店内の雰囲気には似つかわしくないご飯の大盛り加減にびっくり。このあたりはしっかり学生街のツボを押さえているようです。ザイカレーは、この店のオリジナルだろうと思いますが、独特の酸味としっかりとした辛さが特徴的です。激辛が好きな人には大したことは内と思います。付け合わせがピクルスとゆで卵というのもちょっと変わっていますね。ビーフストロガノフの肉はトロトロでとろける食感がなんとも言えません。
デザートはカスタードプリン。テイクアウト用のものしか残っていないということだったので銀カップに入っていますが、苦めのカラメルとしっかりとした食感でこちらも美味しかったです。周りで頼んでいる人が多かったグラタンも美味しそうだったので次回はこちらにチャレンジしたいと思います。
[ロージナ茶房 の続きを読む]
Google が印西市に国内初の DC を開設
google
datacenter Google が日本初のデータセンター (DC) を印西市に開設していました。
以前、グッドマンビジネスパークに用地購入*1したことが報じられていたものが、やっと完成したということですね。
「すでに GCP には asia-northeast1 (東京) や asia-northeast2 (大阪) というリージョンがあるのに、なぜ国内初?」と思いましたが、これまでは equinix などのパートナーが運営している DC が利用されていたので、Google の自社所有として DC が国内初ということになるみたいです。
Google Japan Blog: 千葉県印西市にデータセンターを開設
Google は、千葉県印西市にデータセンターを開設し、本日開所式を行いました。
このデータセンターは、日本で初めてで、Google のツールやサービスを利用する際のアクセスを高速化し、より高い安定性を実現します。
マヤ 勝川駅前店
aichi
curry 今日は投宿先の近くにあったカレー屋さんでディナー。
お腹が空いていたのでマトンカレーセット(タンドリーはチキンティッカ)。明日は朝早くから航空祭なので辛さは無理しないようにちょい辛にしています。
タンドリーは鉄板に載せて運ばれてくるので最後まで熱々の状態で食べられます。カレーはマトンの臭みも感じることがなく、全体としてマイルドな感じに仕上がっていると思います。見た目よりもライスが多かったので、これで十分おなか一杯になりました。
[マヤ 勝川駅前店 の続きを読む]
えきねっとのフィッシングサイトが検索トップになっていることが問題に
phishing
詐欺
railways
google 検索連動型広告を悪用してフィッシングサイトに誘導する手口がニュースになっていたのでメモ。
ユーザー視点から見ると「えきねっと」を検索すると、その結果のトップがフィッシングサイトへのリンクになってしまうのでかなり悪質です。
グーグル検索で偽「えきねっと」 悪用された広告枠、審査強化の訴え:朝日新聞デジタル
インターネットの「検索連動型広告」を悪用した詐欺が頻発している。昨年10月以降、JR東日本のサービス「えきねっと」をグーグルで検索すると、本物そっくりの偽サイトが画面最上部の広告枠に表示される問題が繰り返し起きた。
- sadpkv
- CACHEMANAGER.phpというのはどうだろうかと
- pairb1m
- Lightning のToDoリストを複数のPCで共有できるアドオン
- majodca
- 九州旅行から帰ってきました
- majodca
- 九州旅行から帰ってきました
- hot534
- yum を使って OpenVPN をインストールする
- dresssu3
- NP_Trackbackを騙るトラックバックspamについて
- zippern7o
- NP_SpamBayesJP jp1b
- park81o
- Google Docs をメールフォームとして使う
- fogmpl
- なんで官庁の文章はPDFなんだろうか
- cutjw9
- 即席スライドショーを作る
- frightenlho
- 添付ファイルの容量を表示する「Attachment Sizes」
2 . 福岡銀がデマの投稿者への刑事告訴を検討中(5057)
3 . GitHub が全ての公開リポジトリへのシークレットスキャンを有効に(4193)
4 . 年次の人間ドックへ(4123)
5 . 2023 年分の確定申告完了!(1つめ)(3980)
Academic[574]
Book[155]
Diary[522]
Disaster[101]
Foodlogue[1425]
Game[284]
Goods[805]
Healthcare[341]
Hobby[32]
IT[1195]
Military[343]
misc.[1570]
Mobile[510]
Music[38]
Neta[106]
News[95]
Photo[391]
RealEstate[120]
Security[1178]
SEO Contest[36]
Software[634]
Tips[1886]
Travelogue[1238]
Web[675]
Work[193]





