Azure Speech と bag-of-wordsを使って、録音した授業の音声データから授業の要約を作ろうというプロジェクト
yama @kurikinton105
tomSoya @tomsoyaN
jima884 @jima884
全手順において,まずこのレポジトリをダウンロードしておきます.
初めに必要なライブラリのインストールを行います.
ターミナルでsummary_class_publicフォルダ内に移動し
$echo termextract==0.12b0 >> requirements.txt
を実行した後,
$pip install -r requirements.txt
または
$py -m install -r requirements.txt
を実行する
音声ファイルをテキスト化する処理を行いたい場合,このレポジトリ内のipynbsディレクトリ内の
Speech2Text.ipynbを使用します.
前提としてAzureのSpeechAPIのアクセスキーを取得しておく必要があります.
取得したキー及び地域をipynbs/password.py内に記載してください.
JupyterNoteBookを起動.このレポジトリ内の
ipynbsフォルダのProgram.ipynbを実行することで,結果が出力されます.
sampledata.txtの内容を置き換えることで,別のテキストの要約ができます.
詳しくはipynb内のREADMEを参照.
このレポジトリをダウンロードし,ターミナルを起動.
cdでこのレポジトリに移動した後,以下のコマンドを実行する.
export FLASK_APP=application.py
flask run
set FLASK_APP=application.py
flask run
$env:FLASK_APP = "application.py"
flask run
127.0.0.1:5000及び127.0.0.1:5000/developにアクセスすることで,WEBアプリケーション版を利用できます.
文章か要約,重要語抽出を行う部分のみです
WEBアプリケーション
https://summary-classes-web.azurewebsites.net/
Azure Speech
Bag-of-words
Cos類似度
termextract
http://gensen.dl.itc.u-tokyo.ac.jp/
のコードを使用しています。