文をtf-idfで重み付けしたベクトルで表して、コサイン類似度で類似度を出す方法を試してみる。 まずコーパス内の全ての2-gramを抽出し、重複を削除すると40355個になる。40355次元のベクトルで一文書を表現することになる。 tf-idfで文書内それぞれの2-gram…
テストケース 色々試して返答の精度を上げたいところだが、精度を確認する手段が必要なので、テストケースを作ってみる。 @sa2miへのリプライ最新50件を取得してみた。 gist214520b25537fc6dc58c それぞれに対する返答を見ていって、返答器の評価をする。具…
ブロック崩しをGAで学習させる方法を考える sasamijp/breakout_solver · GitHub まず評価関数を出すためにブロック崩しのシミュレーターが必要。スピードが命なので、めっちゃ速いのを作った。 これは乱数でバーの跳ね返り角度を決めてゲームをやらせている…
未知との遭遇 ゴリラと会話できるサイトを開設した。知ゴリラ1ではゴリラが文法を獲得するというアプローチを紹介したが、今日のテーマは未知との遭遇であるが故に、ゴリラは乱数によって思考するのみである。
ゴリラの知、ゴリラ知、いや、知ゴリラである。 まずSOV文型を使えるようにする。ゴリラ、ジャングル、住む。 人間の文を理解するためのパーサが必要な気がする。 情報を貯めておく必要がある気がする。 言われたことを覚えて、記憶から探して返す必要がある…
こう言われたらこう返すというデータを蓄積して返答させる方法を考えてきた。その方法だと、返答を選びとるにあたって「今話しかけられた文章」というデータしか手がかりにならない。そこで、文脈を読み取る仕組みを考えてみた。 入力とSSをどこまで比較する…
一体何が彼らを動かすのか https://gist.github.com/sasamijp/9217d026dfb451d8062b
<a href="http://www.adventar.org/calendars/391" data-mce-href="http://www.adventar.org/calendars/391">はるアイコン鯖 Advent Calendar 2014 - Adventar</a> ちくわ大明神とその他について書いていく ちくわ大明神 はるア…
基本情報落ちた 作り直した 前々回ぐらいの記事で文章表現を増幅することで細かいニュアンスの変化に対応できるとかいうことを書いたが、色々とやり方が悪くて効果が出なかったのでそれを踏まえて作り直した DB設計 単語に対して品詞データを全て保存してお…
クソみたいなコーパス つらみ これは「トーク長え...」と言われたのに対して「久し振りに...」という返答があるコーパスなのだが、ラジオMC専用の対話システムでもない限り会話コーパスとしてはまず使い物にならない こういった使い物にならない会話コーパス…
重い 18万件も会話コーパスがあるとDBから全部の文章を取り出してmecabで分かち書きして数値出してみたいなことをやるとものすごい時間かかる 10分ぐらいかかる 1回の返答に10分かけるとかやってられないので事前に分かち書きしてDBに保存しておくことにする…
戦いは数だよ兄貴 前々回の記事でノイズの少ない会話コーパスを集めるのが大事といった話を書いたが、それにしても会話コーパスの量が3000とかだと会話するには全然足りないと感じた ノイズの少なさを保ったまま会話コーパスの量を増やすために適当なSSまと…
悲しみ sa2miのツイッターのアイコンが固定なのがちょっと寂しいので会話の内容に応じて変わるようにしたい ミリマス アイドルマスターミリオンライブで会話ダイアログに使われる画像を使う ベイジアンフィルター 文章から感情を判定するためにclassifierと…
前回のラブライブ! ノイズの少ない学習データ(SS)を用意することが一番重要だとわかったのでSS収集をもっとしっかりできるように作ろう ショートストーリーの収集 まとめブログの本文抽出にextractcontentというgemを使っていたのだが精度がよくなくて記事…
「こんにちWAR〜!」と元気に話しかけられるが、そこから一歩でも近づいたら戦争が始まるぞという意味である
SStoAIのちょっと新しいやつができつつあるので試してみる sasamijp/konbu · GitHub ai.respond("hoge") みたいな感じで返答が得られるので翻訳API通して英語で会話してみた 実践 @sa2mi Hello? — コンスタンティノープロブレム (@sasamijp) 2014, 6月 29 @s…
アイマスやりたいんだけどPS3買う金がないのでprocessingでそれっぽいものを作って寂しさを紛らわそうとしたけどやっぱりつらい 裏で動画が流れて、bmp等を設定するとそれっぽく動くんだけど何がしたいのかよくわからなくなってきたのでもうやめる
String.chimpo— ikr7 (@rfc4627) 2014, 3月 31 やるしかない 文字列に対しての勃起率を出すために何から手をつければいいのかわからないのでベイズの定理っぽいものを使って入力された文字列がエロいワードである確率を出してみるものを書いてみる エロい…
SS(ショートストーリー)を人工無能に変換するツールを作ったので使い方を説明します 1. ダウンロード githubから本体をダウンロードするかcloneしてください。 sasamijp/SStoAI · GitHub 2. 解凍 zipかなんかで落としたら解凍しましょう。レンジでチンすると…
@sasamijp じゃあカツ丼で! — 天海春香 (@sa2mi) 2014, 2月 9 今 @sa2mi で動作している人工無能天海春香2のおおまかな仕組みについて適当に解説します。 前回のラブライブ! 従来までのささみbotはただ持っている文章データを使って、マルコフ連鎖でめちゃ…
ささみJPです。今回は update_name Advent Calendar 2013 - Adventar の5日目分の記事です 自分の名前を変更する「update_name」ですが、どのようにして生まれ、現代に継がれているのでしょうか。 その歴史は、人類の誕生にまで遡ります。 世界最古のupdate_…
いつでもどこでも完全勝利ができるアプリを作りました ボタンを押すと背景が変わり勝利のBGMが流れます とっても便利ですね
ぎんこさんツイートとヘッドラインニュース間違えててワロタwwwwwwwwwwキャラクタースマートフォンアプリwwwwwwwwwwwwww— ぎんこさん間違えててワロタbot (@murakamiginko_) 2013, 10月 17
前回鼻セレブを食べたのですが、やはり生では物足りないので、スクランブル鼻セレブエッグを作りました。 材料は鼻セレブと卵です 卵をかき混ぜつつ鼻セレブを加えていきます。 このへんで若干食欲を削がれました。食セレブには強靭な精神力が必要ですね。 …
以前から気になっていたので鼻セレブを食べてみました。 甘さは感じられましたが、やはり噛みにくいですね。どうすれば速く食べられるのか考えていました。 @sasamljp しゃぶりつくしてから食うんだよ、これだから"トーシロ"はよ— 生ごみステーションさん (@…