ささみろぐ

チラシの裏

おちんちんは考える

やるしかない

文字列に対しての勃起率を出すために何から手をつければいいのかわからないのでベイズの定理っぽいものを使って入力された文字列がエロいワードである確率を出してみるものを書いてみる

エロいSSとエロくないSSをそれぞれ2000行ぐらい用意してサンプルデータにするけどこれ全然だめだなって書いてて思った

https://gist.github.com/sasamijp/9913369

文章に対してのスコア

f:id:sasamijp:20140401215821p:plain

下ネタワードが出てくると高めのスコアが出る

ページのエロさを算出してみる

ページ内の全ての文章に対してスコアを出して平均をとる

エロいページの場合

ttp://ssmatomesokuho.com/thread/read?id=180064

{"score"=>0.2415852892504532}

ttp://ssmatomesokuho.com/thread/read?id=213234

{"score"=>0.18451274890425745} 

エロくないページ

ttp://invariant0.blog130.fc2.com/blog-entry-6034.html

{"score"=>0.21386080011166048}

 

全然ダメでした!!!!

 

おちんちんもよくできてるなあと思った