プロデューサーさん、人工無能ですよ人工無能！

@sasamijp じゃあカツ丼で！
— 天海春香 (@sa2mi) 2014, 2月 9

今 @sa2mi で動作している人工無能天海春香2のおおまかな仕組みについて適当に解説します。

従来までのささみbotはただ持っている文章データを使って、マルコフ連鎖でめちゃくちゃに組み合わせて文章を作っていました。これではinput(リプライの内容)がほとんど関係なく、ただ実行される度に文章を生成し意味のないことを喋り続ける機械でしかありません。

人工無能が人間とそれらしい会話をするためには、inputに対して会話になるような返答をする必要があります。

というわけで、inputに対してどう返答したらいいかを考えさせます。人工無能において一番重要な部分です。

「天海春香の返答」を学習させるために、2chまとめのSSから文章をスクレイピングします。手動で。

f:id:sasamijp:20140209155525p:plain

txtファイルにコピペすると、天海春香がこう言われるとこう返すというデータに変換するスクリプトを書きます。

f:id:sasamijp:20140209155833p:plain

データベースとかよくわからないのでtxtで保存します。

えっ？ ||好き

あ、うん、この曲が、この曲がね…… ||曲

「好き」と言われたら「えっ」と返す、「曲」と言われたら「あ、うん、この曲が、この曲がね……」と返す。シンプルな構造です。

しかしこの構造で動かすとなると、膨大な学習データが必要です。頑張ってSSをかき集めましょう。

SSからデータを取ることで、天海春香の人格は人工無能に搭載されます(多分)。しかし色々欠点も多いので、天海春香3を製作中です。つらい

ささみろぐ