Skip to content

cerevo/listnr-server-sample-py

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

listnr-server-sample-py

日本語版

This is a sample server for audio destination of Listnr.

Accept audio upload

  • The sample program is in the “simple” directory.

Installing dependencies

cd simple
pip install -r requirements.txt

Running server

  • Run server.
python server.py
cd audio_sample
curl -H "Transfer-Encoding: chunked" -X POST http://localhost:8080/wave -F "[email protected];type=application/octet-stream"
  • Reload the page opened with a browser, then you will see the uploaded file.

Simple page

Speech to text

Installing dependencies

cd speech_to_text
pip install -r requirements.txt

Create an account for a speech-to-text service

  • This sample uses IBM Bluemix Speech To Text .
  • Please create an account and get a username and password.
  • Add your username and password in speech_to_text/config.ini.

Running server

  • Run server.
python server.py
cd audio_sample
curl -H "Transfer-Encoding: chunked" -X POST http://localhost:8080/wave -F "[email protected];type=application/octet-stream"
  • Reload the page opened with browser, then you will see the uploaded file.

Speech-to-text page

Initializing database

  • Results are saved in textlog.sqlite3.
  • To initialize the database, execute following command.
cd speech_to_text
sqlite3 textlog.sqlite3 < initdb.sql

How to change the audio destination URL of Listnr.

  • Select “Settings” in the navigation menu of the Listnr app.
  • Select your Listnr in the “My Listnr” section to open “Listnr settings”.
  • Select “Audio destination”.
  • Select “Custom”.
  • Input URL.
  • Set “Recording time” if you want.
  • Press the back button to return to “Listnr settings”.
  • Make a sound to get Listnr to start audio uploading. Then Listnr will configure the new settings.
    • Listnr also configures new settings by powering off and on.

How to create an audio file for testing

  • Listnr uploads headerless linear PCM data.
    • Sample rate: 16kHz
    • Sample size: 16bit
    • Channels: 1

Using SoX - Sound eXchange

sox sample.mp3 -b 16 -c 1 -r 16000 -t raw sample.r16

listnr-server-sample-py

Listnrの音声アップロードを受け付けるサーバーのサンプルプログラムです。

音声アップロードを受け付ける

  • simple ディレクトリ以下にサンプルプログラムがあります。

セットアップ

cd simple
pip install -r requirements.txt

実行

  • サーバーを起動する。
python server.py
  • ブラウザで http://localhost:8080/ を開く。

  • サーバーを起動したコンソールとは別のコンソールを開き、音声アップロードをテストする。

cd audio_sample
curl -H "Transfer-Encoding: chunked" -X POST http://localhost:8080/wave -F "[email protected];type=application/octet-stream"
  • ブラウザで開いたページをリロードするとアップロードしたファイルが表示されるはずです。

音声認識する

セットアップ

cd speech_to_text
pip install -r requirements.txt

音声認識サービスに登録する

  • 本サンプルでは、IBM Bluemix Speech To Text を利用しています。
  • 上記サービスに登録し、usernameとpasswordを取得してください。
  • 取得した usernameとpassword を speech_to_text ディレクトリ以下の config.ini に保存してください。

実行

  • サーバーを起動する。
python server.py
  • ブラウザで http://localhost:8080/ を開く。

  • サーバーを起動したコンソールとは別のコンソールを開き、音声アップロードをテストする。

cd audio_sample
curl -H "Transfer-Encoding: chunked" -X POST http://localhost:8080/wave -F "[email protected];type=application/octet-stream"
  • ブラウザで開いたページをリロードするとアップロードしたファイルと認識されたテキストが表示されるはずです。

データベースの初期化

  • 認識されたテキストは、textlog.sqlite3 に保存されます。
  • 初期化するには、以下のコマンドを実行します。
cd speech_to_text
sqlite3 textlog.sqlite3 < initdb.sql

Listnrの音声アップロード先を変更する

  • Listnrアプリのメニューから、各種設定を選択します。
  • My Listnrセクションから、対象のListnrを選択し、Listnr設定画面を開きます。
  • 設定セクションの音声アップロード先を選択します。
  • 音声アップロード先設定画面で、カスタムを選択します。
  • 音声アップロード先URLにURLを入力します。
  • 必要に応じて録音時間を設定します。
  • 戻るボタンを押し、Listnr設定画面に戻ります。
  • Listnrに音を聞かせて、一度集音させます。これにより設定が反映されます。
    • 電源をオフ・オンすることでも設定が反映されます。

テスト用音声データの作成方法

  • Listnrはヘッダなしの非圧縮PCMデータを送信します。
    • サンプリング周波数: 16kHz
    • 量子化ビット数: 16bit
    • チャンネル数: 1
  • 以下の手順で同様のデータを作成できます。

SoX - Sound eXchange を使う

  • http://sox.sourceforge.net/ をお使いの開発環境に合わせてインストールしてください。
  • mp3ファイルを変換するには、以下のコマンドを実行します。
sox sample.mp3 -b 16 -c 1 -r 16000 -t raw sample.r16

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published