Hatena::Groupnadesiko

雪乃☆雫のなでしこ日和

2017/02/04 (土)

Juliusの音声認識を使ってみるよ!

| 12:39 | Juliusの音声認識を使ってみるよ! - 雪乃☆雫のなでしこ日和 を含むブックマーク はてなブックマーク - Juliusの音声認識を使ってみるよ! - 雪乃☆雫のなでしこ日和 Juliusの音声認識を使ってみるよ! - 雪乃☆雫のなでしこ日和 のブックマークコメント

 突然ですけど、ちょっと面白そうだったので、ダウンロードしてみたよ!

 Juliusとゆうのは、音声認識システムの開発・研究のためのオープンソースの高性能な汎用大語彙連続音声認識エンジン…だそうです。

http://julius.osdn.jp/index.php

 読みは、ユリウス? ジュリアス?? どっちだ???


 なんか色々難しいですが、取りあえず、動かしてみるだけなら、カンタンです。

 上の、URLから、ディクテーションキットをダウンロードしてくるだけです。

 ネット上の情報を検索すると、たいがい、まず「最新版」をダウンロードし、しかる後に、「ディクテーションキット」と「文法認識キット」を入手せよとゆうことになっていますが、ディクテーションキットには必要の実行ファイルも入っているので、ひとまずこれだけで問題ありません。

 ムシロ、最新版だけをダウンロードした場合、「・・・でっ?!」この先どーしたらいいんすかと、途方に暮れること請け合いですw

 よく分かんないんで、zipを直でダウンロードしましたが、なかなかのサイズでした;

 コレを解凍して・・・まずは、「00readme.txt」だの「LICENSE.txt」だのにもようく目を通した方がいいんでしょうが、とりあえず「HOWTO.txt」にやり方が書いています。

 マイクをセットアップしたあとに、「run-win-dnn.bat」または「run-win-gmm.bat」をダブルクリックするだけでOK☆

 GMM版はDNN版に比べて精度が下がりますが,の分処理は軽く,処理が高速な

バージョン…で、DNN版は高精度ですが,比較的処理が重く…なるそうです。


 がっ・・・

 ワタシがマイクの設定とゆうモノを全く分かっていないせいか、も、ノートPC内蔵のマイクがしょぼいからなのか、はたまた家の中がFF式ストーブのファンだの加湿器だのサーキュレーターだのメダカのブクブクのモーターだのといった騒音に満ちているせいか、なかなかうまく認識出来ないんだよね~ヽ(;´Д`)ノ

「衆院議員は,具体的にどう考えているのか」
  ↓ ↓ ↓
吸引議員が快適になにを考えているのか。
休眠人が具体的になにを案外いいのか。
衆院二幕は海域になにを考えているのか。
周囲にマグ帯域になにを考えにぴあ。
衆院議員が個体的になにを考えているのか。
衆院議員がふたり、一気になにを考えているのか。
衆院議員が食いたい、絶対的になにを考えているのか。

 こりゃひどい(爆)

 「具体的に」をワタシがしゃべれてナイとゆう可能性もあるが(爆2)


 でも・・・

「任意の読み上げ文発声(対象語彙数6万語)をほぼ実時で90%以上認識することができます」

 ・・・とうたっているのだからして、いかになんでも、まちっとマシにできるハズ。

 と言って、アマゾンでマイクなんか買って、やっぱりうまくいかなかった日にはショックだしぃ、だいたい旦那しゃんが色々買ってくれちゃったおかげでっ(`ヘ´)

 なななんと今月は、はやくも! お金が無いぃ~~Σ(゜д゜;えぇっ!!

 もっと認識精度を上げるべく頑張ってみるか、とりあえず、コレをなでしこから使えるよーにだけしてみるか、悩むね;;;

 なでしこも、TCP/IPの接続ができるから、この認識結果を取り込むことはできると思うんだよね。

めだかめだか2017/02/05 07:09こんにちは!(超早朝

雪乃さんが、僕がしてることと同じことしてて、ちょっと笑っちゃいましたw
一時期音声での、操作簡略化...とでも、言うべきでしょうか。そのようなことをしていましたw
例えば、「音楽を再生」というと、PC内から自動で音楽ファイルを開いてくれ
たり、「天気は」というと、天気をネットから引っ張ってきてくれたりと、色々ありますw(アイアンマンのジャービスに憧れてましたw


ただ、Windows標準搭載の音声認識はポンコツだったり、入力できるまでの過程が長かったりと絶望的でした。
ですが、スマホのGoogle音声認識を使えば、手軽に高精度の音声入力が出来たのですっ!スマホをPCのキーボードかわりにしてやれば、きちんと使えて、高精度な音声入力ができました。


ですが、なでしこを使うものとしてなるべく、外部ソフトに頼らず、なでしこを使って音声入力が出来たらいいなと思いながら、タイピングです( ; ; )

雪乃☆雫雪乃☆雫2017/02/05 16:36 めだかさん、こんにちは☆
 ウチは場合によっちゃ三時起きの日もあるので、七時は早朝のうちには入りませんよ~www

 Juliusは、今はやりの(?)raspberry Piで音声認識機能を組み込むのに使われている定番のソフトらしいんですが、なでしこからも使えそうだったので、ちょっとどうかなーと思ってダウンロードしてみたんですよ。
 とりあえず、なでしこで認識結果を取り込むまでは、成功しました。
 実用としてはどうだかなあと言ったところですが、なでしこを、おもちゃにしている者にとっては、まだまだ遊べる余地がありそうです♪

 こういった外部ソフトの音声認識をなでしこから使用するのではなく、なでしこでこういった音声認識プログラム自体を作りたいとゆうことなんですか?
 それはそれは、なかなかハードルの高い野望ですね!!
 ワタシなんか、Juliusのまにゅあるに書いてあるコトすら、いっこも理解出来ない。とても日本語とは思えん(*_*;
 しかしコレはオープンソースってコトですから(Cだそうですけど)なんらかの参考になるんじゃないですか?(@_@)

めだかめだか2017/02/06 16:56こんにちは~

3時起きですか・・・! 僕も一時期そんな時期がありましたー...w自分、朝苦手なんで、めっちゃきつかったですw

自分の場合は、ユリウス?を入れる時点で、めんどくさくなっちゃって、諦めました\(^o^)/


そうですねぇ・・・なでしこの命令のみでの作成をしてみたな~・・・とは思っていますwですが、以前ちょこっと音声認識のシステムを調べてみただけでも、頭がこんがらがっちゃう感じですぅ~(笑
果たして、これは作れるのだろうか・・・と、途方に暮れていましたw

雪乃さんのコードを拝見させていただいたところ、その方法があったか~と、悔しいというか、やられた思いです(笑


余談ですが、PCのスペックもそんなに高くないので、処理が遅くなったりしちゃうんで泣けてきます・・・
なので、はじめから完璧なコードを書かないと、出来ているはずのことも出来ないとなってしまうんですよねぇ~・・・

雪乃☆雫雪乃☆雫2017/02/07 16:44 めだかさんこんにちは。
 Juliusは、ワタシも当初、インストール・・めんどくさそう・・・。こっ、こんぱいる?!ヽ(;´Д`)ノ など思ってたんです。
 なにしろ、raspberryPiなところにばかり検索が引っかかるので、コマンドプロンプトだらけで、もーMS-DOSの時代のことなんか忘れたんだよ! 的な(爆)
 でも蓋を開けたら、ダウンロード→zip解凍→バッチファイルをダブルクリック・・・だけで行けましたw

 ディクテーションは正直、Windows標準の音声認識よりポンコツですwww
 でも、単語リストや文法辞書を使えば、(認識出来る語彙が少ないので当然っちゃあ当然ですが)なかなか良く認識するので、もう少し遊んでみる予定~☆

めだかめだか2017/02/07 18:16どうもです~

ラブベリーパイは、もともと知っていたのでそこで拒絶はおこらなかったのですが、その跡がめんどそうだったので、諦めました\(^o^)/

ネットにも、いくつかそういったファイルがあるそうですが、なんせめんごくさがりなんで、やめましたw


あ、それと軽い報告なのですが、画像から顔だけを検出するプログラムを考えていたのですが、やはり時間がかかってしまいます・・・
もう少し粘ってみてはみますが・・・

めだかめだか2017/02/07 20:49報告です!

無茶苦茶してなんとか1秒以内に処理をすることができましたw
ただし、検出精度が低い可能性がありそうですw

以上です!w

雪乃☆雫雪乃☆雫2017/02/08 21:27顔検出プログラムですか~、すごいですね!!

トラックバック - http://nadesiko.g.hatena.ne.jp/snowdrops89/20170204