おちんちんは考える
String.chimpo
— ikr7 (@rfc4627) 2014, 3月 31
やるしかない
文字列に対しての勃起率を出すために何から手をつければいいのかわからないのでベイズの定理っぽいものを使って入力された文字列がエロいワードである確率を出してみるものを書いてみる
エロいSSとエロくないSSをそれぞれ2000行ぐらい用意してサンプルデータにするけどこれ全然だめだなって書いてて思った
https://gist.github.com/sasamijp/9913369
文章に対してのスコア
下ネタワードが出てくると高めのスコアが出る
ページのエロさを算出してみる
ページ内の全ての文章に対してスコアを出して平均をとる
エロいページの場合
ttp://ssmatomesokuho.com/thread/read?id=180064
{"score"=>0.2415852892504532}
ttp://ssmatomesokuho.com/thread/read?id=213234
{"score"=>0.18451274890425745}
エロくないページ
ttp://invariant0.blog130.fc2.com/blog-entry-6034.html
{"score"=>0.21386080011166048}
全然ダメでした!!!!
おちんちんもよくできてるなあと思った