シェアする

STT(音声認識翻訳) & RTT(聞き取り認識翻訳)セットアップ方法(更新)【日本語】

シェアする

※放送で利用する事を考慮したセットアップ方法になります※

スポンサーリンク

※動作対象
Windows10 Aprilアップデート適用済み 64bit

1.インストールする物の用意とインストール

下記ダウンローダを利用し、必要ファイルをダウンロードおよびインストールしてください。

VTFDownloader

Downloadsに【VariedTasteFinder】フォルダが生成され、中に各種ファイルが展開されます

  • 【PB_Chrome】:STT及びRTT用のChromeアプリケーションです、各自任意の場所に保管し、ショートカットを生成してください
  • 【VirtualAudioCable】:仮想オーディオデバイスです、中にある【VBCABLE_Setup_x64.exe】を実行しインストールしてください。
  • 【NETDUETTO.exe】:仮想オーディオデバイスです、そのまま実行し、インストールしてください。
  • 【VoicemeeterProSetup.exe】:オーディオルーティングソフト(VoiceMeeter BANANA)です、そのままインストールしてください。

2.VoiceMeeter BANANAのセットアップ

VoiceMeeter BANANAを起動し、下記画像の通り設定します
画像下に説明を記載します

※A1などの説明※

A1 A2 A3 = のHARDWARE OUTに設定されているスピーカーデバイス

B1 = Windows側で設定出来るマイクデバイス(下画像参照)

B2 =
Windows側で設定出来るマイクデバイス(下画像参照)

各種番号を左から順に説明します。※①の上部名前は右クリックから変更できます、画像では既に変更してありますが、自分で任意の名前に変更できます※

自分のマイク:通常利用しているマイクデバイス、ヘッドセットのマイクなどのデバイスを指定する(今までWindows側で規定に設定していたマイクデバイス)デバイス名は各環境で異なるので省略
出力先:【B1】
説明:
通常通りマイクとして自分の音声を流す 自分の音声をモニタリングしたい場合は【A1】を有効化する事で出来る

棒読みちゃん:YAMAHA NETDUETTO Driver(WDM)
出力先:【A1】
説明:
モニタリング用、RTTに流したくないアプリケーションのスピーカーデバイスを【YAMAHA NETDUETTO】とする事で別けることが出来る
棒読みちゃんと命名しているのは、RTTに棒読みちゃんの音声を渡したくない(棒読みちゃんの読み上げ音声も翻訳対象になってしまうから別けたい)為、棒読みちゃんの設定の音声出力デバイス

Chrome音声:CABLE Out(VB-Audio Virtual Cable)(WDM)
出力先:【B1】
説明:ここではSTT用マイクデバイスとして利用する、自分のマイク音声と一緒に載せたいので【B1】に出力させる、同様に自分でも聞きたい場合は【A1】も有効にする

Voicemeeter VAIO

出力:【A1】、【B2】
説明:【A1】自分の耳(スピーカー)へ規定指定されているアプリケーションの音を流す(ゲームやボイスチャットなど)、同時に、Voicemeeter AUX Output 側【B2】に転送する、こちらはRTTへの翻訳対象とする

Voicemeeter AUX

出力:無し
説明:無し

A1:通常利用しているスピーカーデバイスを指定する(今までWindows側で規定に設定していたスピーカーデバイス)デバイス名は各環境で異なるので省略
A2:無し
A3:無し

A1~A3、B1,B2の各種音量などを調整できる、私は音量調整のみに利用している、通常利用のマイク音量はここのB1、RTT側に送っているマイク音量はB2となる

3.Windows側のサウンド設定

予め、PB_Chrome内にある二つのChrome(STT,RTT)
を開いておきます。

下記画像の通り、Windowsのサウンド設定を開きます

1.Windowsの設定を開き、下記画像の緑部分をクリック

2.左メニューのサウンドをクリックし、入力、出力デバイスを画像の通り確認する

3.STT用ChromeとRTT用Chromeへ音声デバイスの指定を行う

青部分は前ページで指定した入力、出力になっているか確認する

STT_JA – GoogleChromeは出力に【VB-Audio Virtual Cable】を指定、入力に【通常利用しているマイクデバイス、VoiceMeeterBANANAで指定した自分のマイクを指定する】

RTT_EN – GoogleChromeは出力に【YAMAHA NETDUETTO Driver(WDM) 】を指定、入力に【VoiceMeeter AUX OutPut】を指定する
※出力を規定にするとAUXに流れてしまう為、翻訳され読み上げられた内容を再翻訳..とループ翻訳してしまう為、聞き取りは別ける用のYAMAHAにする

4.Windowsの規定を確認する

下記画像の通り、デスクトップ上右下にある【スピーカーアイコン】を右クリックし【サウンド】をクリックし開く

再生及び録音の【規定デバイス】を画像の通りに設定する

以上で設定は完了です、翻訳を利用し、話す、聞いた英語などを翻訳し、読み上げしてくれるようになります。
以下は配信時の注意点です

4.配信での音声設定

規定デバイスの指定で問題ありませんが、YAMAHA NETDUETTO Driver(WDM) に指定した音声は放送に載らないようになっています
なのでOBS Studioの場合はソースの追加から【音声入力キャプチャ】を追加し、【ライン YAMAHA NETDUETTO Driver(WDM) 】を追加します

また棒読みちゃんなど読み上げソフトを利用する場合はそれらソフトの音声出力先を【ライン YAMAHA NETDUETTO Driver(WDM) 】に設定します
そうしなければRTT側で認識してしまい、翻訳の邪魔になります、下記画像は棒読みちゃんの設定例です

スポンサーリンク

シェアする

フォローする

スポンサーリンク