「Vtuberの雑学メモ帳」

ブルプロなど注目ゲームの攻略記事&VTuber関係の雑談記事をまとめる雑記ブログ。※少年Vtuber「不断シエル」と姉が運営しています。

【音声認識字幕ちゃん】動作軽め!音声から気軽に日英(日中)字幕を生成してOBS配信で使う方法【自動翻訳】

以前、このブログではゆかりネットコネクターで音声を日英字幕に自動変換しながら配信する方法を紹介した。

▼新ver

vtuber-hudan.hatenablog.com
▼旧ver

vtuber-hudan.hatenablog.com
でも、「とりあえず軽く翻訳できればいい!」という人には動作が軽い「音声認識字幕ちゃん」の方が気楽でオススメだ!


俺が実際にこの翻訳サービスを使ってTwitchで配信してみたところ、配信を始めて2回目で趣味が合う外国の人と楽しく話せたので本当にオススメしたい!!

「どうせ外国の人なんて自分の配信には来ないから…」と思わずに導入しておくと世界が広がると思う。
(俺自身、まさかTwitch配信の初めての視聴者が外国の人になるとは全く予想できなかったぜ)

 

◆「音声認識字幕ちゃん」の紹介

★参考記事[音声認識字幕ちゃん(西村良太)]
★デモ動画[https://youtu.be/Zwsz9_M4Qhs]

音声認識字幕ちゃん」を使うと…

  1. ブクマした「音声認識字幕ちゃん」のURLをchromeで開く!
  2. OBSでchrome(字幕)をウィンドウキャプチャして配信にのせる!

という、たったの2ステップ配信に日本語字幕+英語翻訳や中国語翻訳字幕がつけられるぞ。

音声認識字幕ちゃん」はchromeで指定URLを開いておくだけで日英字幕画面を表示してくれる。
もちろん、日本語字幕だけの表示も可能。

ブルースタックスが前提だったゆかりネットコネクターよりもPCへの負担がだいぶ低いので、ちょっとした配信でも気楽に字幕を生成できそう。

(ゆかりネットコネクター+UDトークは認識&翻訳精度が高く、単語登録できたり、4言語を同時に字幕表示できたりするのが長所。
一方、音声認識字幕ちゃんはとにかく要求スペックが低くて手軽なのが長所だ!)

音声認識字幕ちゃんは多言語(中国語・韓国語・ロシア語~)への翻訳にも対応している
twitch&bilibili動画で配信したいVtuberは要チェック!

 

◆個人的に戸惑ったところのメモ

  • 参照記事2項で取り出したコードをくっつける時は、参照記事3項「オプションがある場合には、最後に~追加」の下にあるURLの末尾にくっつけるのがおすすめ。
    デザインが一番シンプルで字幕向きだ。

 

  • 字幕のフォントを変えたい場合は、まずフォントの正確なファイル名を調べよう。
    コントロールパネル>表示方法[大きなアイコン]に切り替え>「フォント」アイコンダブルクリック>調べたいフォント名を右クリックして[プロパティ]をチェック。
    プロパティ欄のファイル名「〇〇.otf」の文字列〇〇をコピーしておき、URLの区切りっぽいところに&font=〇〇&を半角で追加するとフォントが変わるはずだ。
    (※「けいふぉんと」は〇〇部にkeifontを入れれば変更できた)

    &は前後の命令とつなぐために入れないといけないっぽい。
    デザインを変える命令の一覧表が記事中にあるので、それを見ながら適当な場所に追加しよう!

URLをいじって字幕のデザインを完成させたら、必ずその時のURLをどこかにコピペしておこう。

また、URL変更後にEnterを押してページを更新した後、ブックマークに登録しておけばワンクリックでいつでも同じページにアクセスできる。


★「音声認識字幕ちゃん」はWindows側でデフォルトに設定されているマイク(既定のマイク)を元に字幕生成を行う
そのため雑音を減らせる「RTX Voiceノイズキャンセリング付きヘッドセットなどを入力用マイクに設定しておくと誤変換が少なくなる。
(タスクバー→スピーカーマーク右クリ→サウンドの設定を開く→入力デバイスを選択…で既定のマイクを変更可能)


chromeの画面をOBS側でウィンドウキャプチャする時、そのままだと上側の余計な部分が映ってしまう。
そんな時は、キャプチャ部を選択して赤い長方形を表示し、その後Altを押しつつ頂点をドラッグして拡縮させれば余計な部分を切り取れるぞ!
※よく分からない人は[OBS Studio でクロップ(トリミング)を行う方法 | Lonely Mobiler]を読んでみてくれ。

★緑色の背景はOBS側で「ウィンドウキャプチャ」の名前部分を右クリック[フィルター]追加[クロマキー]を追加すれば透明になる。

 

chromeを閉じると字幕も生成されなくなるので、ウィンドウは横長の状態で画面外ぎりぎりに活性化させておこう。
デュアルモニター環境なら特に問題なく使えるはずだ!
chrome向け拡張機能Window Sizer」を使えばウィンドウサイズのテンプレートを複数記憶できるため、毎回サイズ調整する必要がなくなって便利。


音声認識の翻訳精度をあげる方法

  • 1文の中にできるだけ主語と述語を入れる。
    主語を入れずに話すと、あなたが~→私が~に翻訳されたりしてしまう。
    主語と述語をハッキリ話すことがかなり重要。
    ただし、主語が入れ替わっていても名詞や動詞は正確に翻訳されることが多いから、日本語入力さえちゃんとできていれば大体の意味は伝わるようだ。

  • 早口にならないよう、滑舌が良い大きな声で話す。
    文節を区切ってゆっくり話す音声認識がうまく機能する。
    話し手の滑舌も大事なので、話す前に「らりらりらるらるられられらろらろ」、「たちたちたつたつたてたてたとたと」など特に噛みやすい行の準備運動をしておくのがおすすめ。

  • 比喩やスラングを使わない。
    「~風の」「草w」「まじ卍」など、比喩表現や俗な表現は翻訳してくれない
    うまく翻訳させるには英語の教科書に出てくるような不自然だけど分かりやすい日本語を喋る必要がある。

  • ゲーム内用語の使用を避け、誤認識しづらい一般単語に言い換える。
    ゲーム用語は特に誤変換されやすいため、同音異義語が少ない同じ意味の単語を使おう。
    例えば、本陣→本拠地、兵団→戦士・兵士、攻城戦→バトルなどに言い換えると目に見えて誤変換が減る。

  • 認識されづらい単語と認識されやすい単語を覚えておく
    「俺」より「私」の方が正確に単語を拾ってくれるなど、自分の喋り方の癖を知っておくと誤変換が減るぞ!