Giter Site home page Giter Site logo

memakura / s2listen Goto Github PK

View Code? Open in Web Editor NEW
0.0 1.0 0.0 4.15 MB

Speech recognition for offline scratch 2 (Julius)

License: BSD 3-Clause "New" or "Revised" License

Python 100.00%
scratch julius speech-recognition speech-to-text scratch-extension python offline msi

s2listen's Introduction

(English) (音声入力デバイスの設定) (他の拡張ブロック)

s2listen

Speech recognition blocks for offline scratch 2 (powered by Julius)

s2listen

インストーラ版はこちら

Python のインストールが不要です。

以下では Python から実行する場合を説明します。Python をインストールせずに実行する場合は上のインストーラ版をお使いください。

設計方針

必要なもの / Requirement

  • Windows 10 (64bit) (Windows 7 や 8でも可?)
  • Scratch 2 offline editor
  • Python 3.5 (64bit)
    • aiohttp (pip install aiohttp しておく)
  • さらに、julius/model 以下の大きなファイルのダウンロードには git lfs が必要

デモ

  1. Scratch 2 (offline) を立ち上げる
  2. 00scratch/s2listen_demo.sb2 を開く
  3. Pythonの動くコマンドラインで s2listen.py を実行する : python s2listen.py

使い方

  1. Scratch 2 を立ち上げる
  2. [ファイル] をシフトクリックして実験的なHTTP拡張を読み込みを選ぶ
  3. 00scratch/s2listen_JA.s2e を開く
  4. s2listen.py を実行する
  5. オプション
    • -m DNN (音響モデルをDNNにする。デフォルトはGMM)
    • -d (数字) (マイク入力のデバイスを指定する: 何もオプションを指定せずに実行したときにはデフォルトのデバイスが選ばれる)
    • 指定できるデバイスは、julius が立ち上がる際に表示されるリストから選択可能
    STAT: ###### initialize input device
    [start recording]
    Stat: adin_portaudio: audio cycle buffer length = 256000 bytes
    Stat: adin_portaudio: sound capture devices:
    1 [MME: Microsoft サウンド マッパー - Input]
    2 [MME: マイク配列 (Realtek High Defini]
    3 [MME: ヘッドセット (SoundBuds Slim Ha]
    9 [Windows DirectSound: プライマリ サウンド キャプチャ ドライバー]
    10 [Windows DirectSound: マイク配列 (Realtek High Definition Audio)]
    11 [Windows DirectSound: ヘッドセット (SoundBuds Slim Hands-Free)]
    

音声入力デバイスの設定

  • はじめて使う場合や認識がうまくいかないときは wiki/SetInputDevice を確認

音響モデルや言語モデルの差し替え

  1. .\julius\model 内 のファイルを差し替える

ライセンス

  • 修正BSD
  • Julius関連は ThridPartyLicenses.txt に従います。

  1. Run scratch 2 (offline)
  2. Open 00scratch/s2listen_demo.sb2
  3. Run s2listen.py from command line : python s2listen.py

How to use

  1. Run scratch 2
  2. Shift-click the File menu and select "Import Experimental Extension"
  3. Open 00scratch/s2listen_EN.s2e
  4. Run s2listen.py

Add/change htsvoices

  1. Replace files in .\julius\model

License

  • New BSD
  • See ThirdPartyLicenses.txt for Julius related files.

Notes

  • Julius Dictation Kit 4.4 is used; see ThirdPartyLicenses.txt
  • Asynchronous I/O (asyncio) HTTP server (aiohttp) is used
  • To build .msi, run python setup.py bdist_msi with python 3.5 (64bit)

s2listen's People

Contributors

memakura avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.