この記事を書いた人

ボイスチェンジ:VtuberとVの者のためのボイチェン知見【保存版】

 

 

VtuberとVの者のためのボイチェン知見、ということでボイスチェンジについての記事ですが、調べまくった結果のまとめのような感じです。

今年の8月ぐらいに調べ始めて情報を蓄積していったのですが完成させずにずっとドラフトのまま何ヶ月も公開しないままでした。
ようやく公開。

といっても調べた結果を記事としてまとめたので、「~のようです、~らしいです、~だそうです」などが頻出しますのでご了承ください。
あと、How to というよりもっと前の「なにが必要なのかが分からない」という部分のための記事です。

 

 

ソフトウェア

 

ボイチェンをするにはいろいろありますが、主に2つに分けられるようです。
1つ目は恋声
2つ目は、VSTというDTM(デスクトップ・ミュージック)用のプラグインたちを使う方法。

様々な意見がありますが、やはり「ソフト1つで完結して、しかも80点くらいの結果を得られる恋声はヤバイ」というのが大体の感じです。
とはいえ遅延なども多少あり、それを嫌う人は、ガチ勢向けのデジタル機材であるVSTプラグインをいろいろと使っていきましょう、となっています。

 

 

基礎:恋声仕様

 

 

入門的立ち位置のソフト「恋声」です。
良くわからない謎の技術が使われているとの噂もありますが、真相は定かではありません。
手軽にkawaiiになれると世のVの者から熱い視線を集めているようです。

遅延があると言われていますが、2018年の半ばごろのアップデートで低遅延のセッティングが追加されています。

 

必要なもの

 

  • ボイスチェンジャー:|恋声(ピッチとフォルマントを調整。EQで音域の調整)
  • ミキサー:(入力や出力を任意のソフト等に送り込むソフト or ハードウェア)|Voicemeeter banana(Software)

 

▽主要参考知見

メイン:恋声の調声で得た知見たち
補助知識:ボイスチェンジャーアプリ「恋声」を使ってみる

 

 

発展:VSTプラグイン仕様

 

VSTというDTM用プラグインを使ってピッチやらなにやらを弄る方法です。
プロ用ツールも探せばいくらでもあるので、遅延フリーでノイズも少なくできるそうです。

VST仕様では、

  • VSTクライアントというプラグインを乗っけるためのベースソフトと、
  • そのクライアントインストール先のpluginフォルダなりに置いて認識させるVSTプラグイン

とによって構成されるようです。

 

必要なもの

 

  • VSTクライアント:(VSTプラグインを結線してIN/OUTするベースソフト)VST HOST、Reaper、Cakewalk by BandLab など
  • ボイスチェンジャー:(ピッチとフォルマントを調整)|Robeer 、ReaPitch(Reaperの標準搭載ピッチシフター)、Graillonなど
  • EQ:(耳障りな音域を削る、ほか)|TDR NOVA、Reaper標準EQなど
  • ミキサー:(入力や出力を任意のソフト等に送り込むソフト or ハードウェア)|Voicemeeter banana(Software)

 

▽主要参考知見

 

音屋がボイチェンをガチ検証してみた
恋声が合わなかった人にも試して欲しい、VSTプラグインでボイチェンする方法

 

 

ミキシング

 

Voicemeeter Banana関連

 

 

人間どもー、VoicemeeterBanana(VB)だぞ。
ミキシングです。
まぐろなちゃんで知りました。
これは音を仮想的に配線して、任意の場所へ送り込むためのものです。ミキサー。

これを使うときは規定のデバイスにVBを指定する必要があるので、常用する場合にはオーディオ関連の環境が変わりますので頭に入れておくと良いでしょう。
私は便利なので、今では常時規定のデバイスにこのVBを指定してオーディオなども聴いてしまってます。

実際の使用だと以下のような流れを取るようになります。

VoicemeeterBananaを使用したボイチェンジの音の流れ
マイク→VB→ボイスチェンジのソフト→VB→録画ソフト、チャットやVRCなどの色々なソフト

 

▽主要参考知見

基礎:「10分で分かる恋声+VoiceMeeter Banana+Skype設定」
詳細:ステミキいらず!仮想ミキサーVoicemeeter Bananaを使ってDTM配信をしてみよう

Bananaでの音の通し方1:「配信や動画にVC音を入れない方法、Voicemeeter Bananaの使い方と設定の解説。USBヘッドセットもOK」
Bananaでの音の通し方2、特にVirtual Audio Cableを使った通し方:「バーチャルキャストで遊ぼうと思ったときに 音で悩んだりしたので自分で解決していった方法」

 

番外:OBS(配信+録画ソフト)の知見

 

 

ボイチェンとは主旨が少々ずれますが、最終的なエクスポートとしてアバターを録画するならOBSなどを利用するのがおすすめです。
よくゲーム実況なんかで、アバターとゲーム画面が一つの画面に合成されてるのがあって「あれはどうやってやってるんだろう」と最初の頃思いましたが、
大抵の場合は、グリーンバック等の切り抜き(マスク)用を背景にしたアバター動作ウィンドウを録画ソース1に、
録画ソース2にゲーム画面を指定し、その2つをクロマキー合成という手法でリアルタイム録画・あるいはあとから編集で合成しているようです。

OBSは大体クロマキー合成がついてるので、リアルタイム録画する際はいっぺんに合成映像が出力できてラクなのでおすすめです。
(おすすめですとか言いつつ、Youtuberになる気は私は全くないですけど)

OBSはStreamLabsをオススメします。(ロゴがかわいい&UIがステキ。
使い方:「StereamLabs 使い方」検索
操作は直感で大体わかります。
録画は、nvidiaのグラフィックボードを使っている人は、 設定>アウトプット から、「NVENC」 を選択して録画しよう。
CPUではなく、GPUで録画できます。

 

リアルタイムではなく後から編集するには、PremiereProとかの映像編集ソフトでグリーンバックを抜いて使うのでしょう。

 

OBS補助

基本的なOBSについての知識は、sloppy-games.comさんがゲーム実況向けOBS記事が分かりやすい。

あとは、
OBS Studioに関する個人的メモ
【雑談】配信者のためのOBSテクニック
など。

OBSの音声フィルタの使い方、音質を最高レベルに引き上げよう!」なども。|※ダイナミックイコライザー「TDR Nova」の操作方法もあり。

 

 

【ハードウェア】

ハードウェアは全然わかりません。

音楽業界は色々複雑で素人には荷が重すぎるので、詳しい人の解説をお願いします。(聞こえていますか…今あなたの脳内に…直接語りかけています…マイク解説記事を…書くのです…)

マイク

マイクは美少女の声帯である。(パワーワード感。
とはいえ先程書いたように全くわからないので(XLR?なにそれおいしいの?)、ここではすごい適当にまとめます。

 

まずはじめにHTC VIVEやOculusRiftを使う人であれば、ヘッドセットにマイクが付いているのでコミュニケーション用であれば不要です。(音質を考慮しなければ。)

別途マイクを用意する人は、大体はコンデンサーマイクを用意しておけばよいようです。→ソース
ただし「道路沿いの家」や「PCの動作音が大きいor置き場所がマイクと近い」場合には、いろいろと面倒で、私も諸事情でPC本体をデスクに上げているので、動作音を拾ってしまいました。
このあたりどうするかは、私は現状沼っているのでなんともいえませぬ。

 

選択肢1:USBマイク

 

USBマイクで安いやつを買う。
ちなみに私は、適当に生贄として最初にこの↓やすいのを買ってみました。

音質はどうか?というと、内蔵アンプ(?)がしょぼいのか音量を上げるとノイズが出がちな印象。
でも意思疎通ができればそれでいいのであれば、このあたりのものでもいいのかも。

 

値段はお手軽でない(¥15.800くらい)ものの、手軽にUSB接続で音質がよいマイクだとBlueというメーカーの「Yeti」というやつがいいらしい。
指向性を4つから選べるのですが、そのなかの正面だけ音を拾う「カージオイド」だと

カージオイドだとテレビのスピーカーの前に置いても相手にテレビ音は「ほぼ聞こえない」ようです。
色々試しましたが、表記通り手前に対して扇状のみ音を拾うようです。左右はかなり遮断されています。
Amazonレビューより

だそうで、私のような環境でもイケるんではなかろうかと目論んでいます。

 

選択肢2:ちゃんと機材を揃える

真面目に機材を用意するスタイル。
マイクはXLR端子のもの用意、オーディオインターフェースを用意、など。

この文脈で、いろいろネットの海を彷徨っておすすめされてきたやつを、価格順(安)にリストします↓

 

BEHRINGER
C-1 Studio Condenser Microphone

 

 

 

選択肢2+:マイク周辺機器

 

◎は必須。◯は音質向上を目指すなら揃える。

 

◎ケーブル

今まで関わりがなくて全然知りませんでしたが、マイクケーブルの端子規格は、XLRというそうです。
マイクケーブルは、USB接続なら必要ありませんが(USBケーブルは大体付いてくるでしょう)、マイクがXLR端子のものだとケーブルが必要です。

マイクケーブル(XLRメス-XLRオス(マイク)):CANARE
EC015B BLACK

マイクケーブルにClassicPROっていう安いヤツがあって、それを買おうとしましたのですが、なんかスレでダメだと書かれていたのでCANAREにしました。(単純)
CANAREのシールド(ギター用のケーブル)は以前に使ったことがあったので信頼してます。

BELDENでも良いと思います。ちょっとお高め。
ちなみにBELDEN 8412はダイナミックマイク用、8413がコンデンサマイク用となっているそうですが、詳しいことは分かりません。
沼るので深く考えないことをオススメ。
8412 → 2芯ケーブル → アンバランスケーブル
8413 → 3芯ケーブル → バランスケーブル

(どうやらコンデンサーマイクには3芯がいいそうです。)

 

◎オーディオインターフェース

XLRのマイクでも、反対がフォン端子のケーブルをつなげてMIC端子に差せば動作するといえば動作しそうですが、音量が足らなくなりそう。マイクアンプの項で説明。
たぶん、事実上必須になりそう。

 

このあたりを買えばいいのではなかろうか。

 

◯マイクアンプ:

MIC端子にぶっ差すとマイク音量が足らなくなるのでは、という懸念ですが、そもそもマイクというのは、入力レベルがすごく低いデバイスのようです。
なのでいろいろとアンプで入力を増幅させる必要があるのですが、この増幅を専用でやるのがマイクプリアンプというものらしいです。

オーディオインターフェースのゲインと何が違うんだ?

ともかくこいつを通すと、きれいに音量が増幅されるみたいです。
ちなみにマイクプリアンプの”プリ”は「前」という意味があるそうで、マイクの接続機器の中で一番最初に通すようです。

audio technica
AT-MA2

◯マイクプリアンプ→オーディオインターフェースケーブル:audio technica
AT561A 1.0m

 

 

マイク結論

 

ただし、わりとデカい。

 

よけいなことを考える時間をなくし頭を早急に無にしたい場合Blue Microphones Yeti USBマイク を買えばいいのではなかろうか。たぶんApple製品っぽい使用感だと思う。
人柱求む。

Window派の人とか線がいっぱいある複雑な塊になぜか燃える人は、オーディオインターフェースとか揃えたりしちゃってもいいかも。

 

ちなみに、HMD付属マイクは使わず、かつアクティブに動きたい場合、シロちゃんマイク↑を買う人もいるみたい?

 

 

実際のVoice changeの仕方

 

世のおじs…ごほん、
お兄さn、
kawaiiたちが色々記事、動画等あげてるので調べてください。

 

あとがき:パロールとエクリチュール

 

調べ始めたらボイスチェンジというワード・世界は、沼どころかメイドインアビスの穴くらい深いものでした。ボイスチェンジこわい。

こんなに調べた結果ですが、個人的には声を発するのも面倒くさいと思っている常に省エネモードな人なので、デジタル空間ならではの多様なコミュニケーション手段として、キーボードタイプですてきなkawaiiボイスを出力できるようなスタイルが確立されないかと思っています。
のらきゃっとスタイルを更に無味乾燥にしたやつ。
壇上とかで発表とかするのが生まれ変わっても無理な人種向けに、ポチポチするだけで行ごとに原稿を読んでくれたりするとなお嬉しいですね。
私は、話し言葉人間ではなく完全に「書き言葉人間」なので。

VRCでは、タイピングでテキストを表示させるアドオン的なものが開発されているのを見かけましたが、WebPanelがお亡くなりになったことで灰燼に帰したようで残念でした。

 

「実のところ、これは僕自身が無言勢のフレンドと会話するために作ったワールドなので、自分が使えればそれでいいやと思っていたのだけど、けっこう他の人にも活用してもらっているようだ。Discordで海外の人から深い感謝の言葉をもらったときは、このワールドを作って本当によかったと思った。」
https://medium.com/@kanata/vrchat-millions-of-stars-5a76ca6bd0d8

 

人間の意思疎通の形式には、パロールエクリチュール、があると言われています。

パロールは話し言葉です。

一方エクリチュールは「書かれたもの」や「文字」、「書くこと」や「文体」、「書き言葉」を意味する言葉です。
哲学的な話になりますが、この語を哲学的概念として定式化したのはジャック・デリダで、西欧の思想を支配してきた話し言葉=ロゴス中心主義を脱構築するために、他方で理性、合理性、論理であるエクリチュールに着目したのでした。

デリダは、西欧の思想が、この二つの意味でのロゴスを最終的なよりどころにしてきたことを、プラトン、ルソー、ソシュール、フッサールらのテクストに沿って実証する。そして、完全な自己現前は不可能であること、パロール(話し言葉)がエクリチュールよりも直接的に語り手の意図を伝達できるわけではないこと、またしたがって単線的で一元的なテクストの意味はなく、一つのテクストにも多くの正当な解釈がありうることを主張した。https://kotobank.jp/word/%E3%82%A8%E3%82%AF%E3%83%AA%E3%83%81%E3%83%A5%E3%83%BC%E3%83%AB-36302

 

VR空間はなんでもありの世界なので、エクリチュール美少女にも優しい世界が構築されないかと他力本願で期待しているところです。

VRC無言勢とか見かけたし需要あると思うので、なにかそういうコミュニティがSlackなりDISCORDなりであったらぜひ教えてください。
あとがきを書いてたらちゃんと記事にしたくなったので、後で

「話さない自由:VR空間における対面でのエクリチュール”書き言葉”コミュニケーション」

的なタイトルでブログを書きたいなと思いました。

おわり!

 

 

この記事を書いた人

イズミ リム

伊澄 理夢 / イズミ リム / IZUMI Rhime
2017年3月からブロックチェーンに興味を持って以来、デザインの面から、"NEM"を通じて技術の普及に貢献できる道を探しています。
児童文学と純文学、哲学と現代思想、仏教と禅、黒い服と民族衣装が好きなINTROVERT(内向型)です。
大学ではデザインを学ぶ。