Hotchpotch Editer ver1.10 このソフトは色々な機能が付いたテキストエディタです。 @ネットワークを使って文章を取れる A自動で文章を作れる メニュー欄の説明  ・ファイル   ・新規 メッセージボックスの内容をクリアします   ・開く メッセージボックスに指定したファイルの内容を表示します   ・名前を付けて保存 メッセージボックスの内容を指定したファイル名で保存します   ・終了 このソフトを終了します  ・ソース 自動で文章を作るためのファイルを指します   ・作成 ソースを指定するファイル名で作成します   ・上書き保存 現在のソースの内容をメッセージボックスの内容で上書き保存します   ・表示 現在のソースの内容をメッセージボックスに表示します   ・変更 現在指定しているソースから指定するソースに変更します  ・ネットワーク   ・取得 コンボボックスで指定したURLに繋いでファイルの内容を表示します   ・リンク一覧 取得したURLにある全てのリンクを一覧にして表示します   ・文章抽出 取得したURLにある文章を表示します   ・取得ソース表示 取得したURLにあるファイルのソースを表示します   ・ランダム移動 取得したURLにある全てのリンクからランダムに一つ選んだURLに繋いでファイルの内容を表示します  ・文章   ・生成 メッセージボックスのキャレット位置にある文章に関係なく新たに自動で生成した文章を挿入します。   ・挿入 メッセージボックスのキャレット位置にある文章に従って右に自動で文章を挿入します。   ・整形 メッセージボックスの文章にある改行やタブや全角スペースや半角スペースを全て無くして、「,」や「,」を全て「、」にかえます。 学習の説明  メッセージボックスの内容を学習します。学習する文章は自動的に「整形」されます。  大量に学習できるようにネットワークを使って文章を取れるようにしましたが、綺麗に取れるページと取れないページがあります。  文章が中心のページだと効率良く綺麗に文章を取れますが、文章があまり無いページだと単語の羅列のような文章になってしまいます。  綺麗に取れない場合は、メッセージボックスで綺麗にするか綺麗に取れるページを探した方が良いでしょう。  また、他から得た文章をメッセージボックスにペーストして学習させることもできます。    学習の仕組みは、字種が違う文字を分けて三つ一組の連続した組み合わせを得ています。  その組み合わせをランダムで繋げていくと文章を生成できます。  学習すればする程、学習した文章とは違う文章を生成します。    例.  「いわゆる人工無脳と呼ばれるソフトが使っている技術です。」−字種で分ける→「いわゆる 人工無脳 と 呼 ばれる ソフト が 使 っている 技術 です 。」  「私は人工無脳とチャットがしたいです。」−字種で分ける→「私 は 人工無脳 と チャット がしたいです 。」   組み合わせは、「いわゆる,人工無脳,と」「人工無脳,と,呼」のようにCSV形式で記録されています。   繋げ方は、文章を後ろに繋げていく場合は組み合わせの前二つが同じものの三つ目を文章の後ろに繋げる方法です。   私 は 人工無脳 → は 人工無脳 と → 人工無脳 と チャット のように前二つが同じものが複数あるとオリジナルの文章を作れます。                       → 人工無脳 と 呼  「私は人工無脳と呼ばれるソフトが使っている技術です。」というような文章ができたりします。 コンボボックスの説明  コンボボックスにURLを書いて取得ボタンを押すと、コンボボックスで指定したURLに繋いでファイルの内容を表示します。  指定するURLはhttp://から書いても書かなくても対応します。  また、コンボボックスにURLではない文字を書いて「文章の生成」をすると、コンボボックスの文字が必ず含まれる文章を生成します。  因みにURLではない文字は、文字の最後が/ではなくて文字の最後から5byte以内に.が含まれていない文字としています。  コンボボックスに登録されているURLは、URL.txtというファイルをもとに構成されています。そのファイルを操作することでURLを追加や削除してください。 今後の展開と関連話しと感想  どんなページのものでもネットワークから取得する文章を綺麗に取れたら、さらに大量に学習できます。  今の段階では自動で生成する文章が構造的におかしい場合や意味的におかしい場合があります。  それを解消するには、字種で分けないで形態素解析器というものを使って形態素で組み合わせを作って、繋げ方を制限する方法が考えられます。  繋げ方を制限する効果的な方法は、繋ぐ形態素という単語のようなものの品詞を識別する方法です。  1年くらい前に、chasenという形態素解析器をパイプから利用して人工無脳を作って学習させていました。  しかし今のパソコンではなぜかパイプから形態素解析器を利用できないので、このように字種で分けています。  この字種で分ける方法でも楽しいオリジナルの文章を作れるので良かったです。  本当はこの文章の様に視覚的に作られた文章を含んでいる文章はあまり向いていないのですが、この文章をまずは学習させるのはどうでしょうか。  オリジナルの文章を作っていることがわかると思います。