いろいろ言われている話だし、記事もたくさんあるのだけど復習とメモがてら。
まずMSDNを読もう。
要はバイト列(byte[])だろうとストリームだろうと取れるのだけど、単に小さいファイルのmd5値を出したいのであればbyte[]を読ませたほうがコーディングが楽だと思った。
というわけでワンライナーで。
File.ReadAllBytesはファイルパスからbyte型の配列としてファイルを読み込むので、これをMD5.ComputeHashに渡す。
ちなみに戻ってくるのはbyte列なのでこれをBitConverterでstringに直して、そんでもってハイフンを消したり。
主にここらへんを参考にしました。
まずMSDNを読もう。
要はバイト列(byte[])だろうとストリームだろうと取れるのだけど、単に小さいファイルのmd5値を出したいのであればbyte[]を読ませたほうがコーディングが楽だと思った。
というわけでワンライナーで。
string md5hash = BitConverter.ToString(MD5.Create().ComputeHash(File.ReadAllBytes(@"C:¥hoge.exe"))).ToLower().Replace("-", "");
File.ReadAllBytesはファイルパスからbyte型の配列としてファイルを読み込むので、これをMD5.ComputeHashに渡す。
ちなみに戻ってくるのはbyte列なのでこれをBitConverterでstringに直して、そんでもってハイフンを消したり。
主にここらへんを参考にしました。
研究用のデータセットに大量のbeneign softwareが必要になったので、Vectorから一気に落とそうと思った。
というわけでググってみたところ、数年前まではanonymous ftpがあったらしいのだが、今は使えないようなので、スクレイピングしてみることにした。
neta@neta__
@takamuko_k @s4kura_4m4ne 一筋縄には行かなさそうなのでMechanizeでスクレイピングしてリンクたどっていくPerl/Rubyスクリプト書いてみては
2012/12/03 15:47:20
このアドバイスをもとにれっつ☆スクレイピング in Perlです
(成果物はhttps://github.com/t-chov/vectorScraperに置いてあります)
※WWW::MechanizeとWeb::Scraperを要求します
続きを読む








