音声入力の「精度」と「マイク」の関係を徹底検証してみた → オススメは○○のマイク

人生の最適化
スポンサーリンク

こんにちは、Make Wakの (@wak198)です。

今回は「音声入力の精度」と「マイク」の関係について検証してみたのでその結果についてレポートしていきます。

皆さんはふだん、音声入力に関してこんな悩みをお持ちではないでしょうか?

  • 最近あちこちで「音声入力は良い」と聞くので試してみたけど、
  • イマイチ精度が良くなくてモヤモヤしている
  • 楽になるかなと思ったけど、 誤字の修正に時間がかかるので結局使わなくなってしまった

これ、けっこうあるあるだと思います。

実際僕も、こうやってきちんと検証するまでは、パソコンの音声入力の精度ってイマイチだなと思って使ってなかったんですよね。

でもそれ、もしかしたら使っているマイクに問題があるのかもしれません。

そこで今回は実際に、安物のマイクと、きちんとしたマイクを使ってみて音声入力の精度を比較して検証してみました。

結果から先に言ってしまうと、やっぱりお値段が高いマイクを使うと、相当精度よく音声入力ができるのでオススメめですよ!

それではいってみましょう!

結論:音声入力にはBlue Yetiを使え!

いきなりですが今回の結論から述べていきます。

今回お伝えしたいことは以下の3つです。

<今回お伝えしたい結論>

  1. 安物マイクと、きちんとしたマイクでは音声認識の精度に雲泥の差が出る
  2. 入力の手間が省けることで結果的にコスト削減ができるので、きちんとしたマイクを用意するべき
  3. おすすめはBlueのYeti

このままだとよくわからないと思いますので、 順番に解説していきます。

検証結果:Blue Yetiの圧勝

まずは簡単に検証の説明から。

以下のような実験条件で、マイクだけ変えてその入力の精度を比較してみました。

<実験条件>
・Windows PC(Surface Pro)を用いて
・Googleドキュメント上で
・Google音声入力を行い
・例文を入力し、精度を確認
・以上を安物マイクと購入マイクで比較

検証に使ったマイクはBlue Yeti と、

こんな感じの安物 USB マイクですね。

それでは、検証の結果をざっくり見ていきましょう。

このように、 Blue Yeti のマイクと安物の USB マイクを使って音声入力をしてみて、 入力の精度をパーセンテージで表示しています。

見てもらうとわかるように、 同じマイクでもマイクと口の距離によって精度が変わっていきますので、0 cm、 50 cm、 100 cm の三水準で検証をそれぞれ行っています。

この一覧から言えることは以下の3点ですね。

  • Blue Yeti のマイクは距離に関わらず高い認識精度を維持できる
  • 安物の USB マイクを使うと0cmのときから精度が悪い
  • さらに安物のマイクの場合、距離が離れるとてきめんに入力の精度が落ちていく

というわけで、音声入力の精度にはマイクのレベルが大きく関わっているということが明らかになりました。

やはり1万円を超えてくるような高級マイクを使っていると、音声入力の精度は数段上がる感じがありますね。

考察:お金をかける価値は

ここで、こんな疑問が浮かんできます。

「それは Blue Yeti の方が精度は高いけど、購入金額が高いじゃん。」 「安物マイクでも、認識精度が90%近くあるなら、それで頑張ればいいんじゃないの?

「Blue Yeti って17,000円もするじゃん。YouTuber でもないのにマイク買うとかアホなの?」

僕も同じことを思いました。

ので、少しコストの計算をしてみました。

  • 入力精度が5%違うと、1,000字あたり50文字の追加修正が必要
  • 間違いを探し、文章の構成を考え、修正タイピングをし、修正したものを確認するところまで考えると、50字の修正は3分強かかる
  • 自分の場合、毎日1,000字強の執筆なので、毎日3分は伸びる
  • 365日で約1000分。自分の時間単価を1,500円として、25,000円のコストが余計にかかる

と、いうことは、 Blue Yeti を17,000円で買っても1年でお釣りがくる計算ということです。

これなら十分投資として価値がありますね。

よく考えてみれば、パソコンに10万円とかかけるわけです。

人によっては、 キーボードやマウスに1万円かけるという人もいるでしょう。

これはパソコンが毎日使う仕事道具だからです。

少しでも効率よく仕事ができるようになれば、 必ず元は取れますのでそこに投資をしているわけですね。

最近の技術の進歩によって音声入力の精度は劇的に上がってきました。

それこそビジネスに使えるレベルに、です。

どういうことかというと、マイクも仕事用の入力デバイスの一つとしてお金をかけても元が取れるような時代になってきたということです。

まあそんな難しいことを考えなくても、実際導入してみるとその快適さにビックリしますので、それを味わうだけでも十分価値はあるかなと思いますよ!

おすすめマイク:BlueのYeti

ちなみに、 入力の精度が上がればマイクのメーカーは問わないのですが、おすすめは Blue Yeti マイクですね。

理由は「実績がはっきりしているから」です。

僕も実際に使ってみて確認していますし、こちらの記事のようにさまざまな方が Blue Yeti を使った音声入力を実践されてその精度を評価されています。

この方とか、

USBマイクYetiで、音声認識入力の精度アップ | EX-IT
音声認識入力に最適なマイクを探しつつ、今は、でかい有線マイク、Yetiに落ち着きました。 ※自宅にて Pixel 3   音声認識入力のメリット   2016年...

勝間和代さんなんかは、音声入力を使いこなしていることで有名ですね。

本を何冊も執筆されるような方でも、音声入力+Yetiの組み合わせは実用に足るレベル、ということが伺い知れると思います。

また、Blue Yeti には Blue Yeti X なんかの最高級シリーズもありますが、そこまで高級品でなくてもいいと思いますので、 普通のBlue Yetiをお勧めします。

正直この辺の情報ってまだまだ少ないので、実績のあるモノをサクッと買って実際に使ってみるのが手っ取り早いと思います。

参考:検証データ詳細

ここでは参考までに検証データを詳細に載せておきます。

安物マイクの検証結果

夏目漱石の吾輩は猫であるを音声入力してみて、お手本の文(左)と入力された文章(右)の変更点をパーセンテージに換算していきます。

①マイクと口の距離0cmのとき

まず最初に、 安物のマイクを使っても、口との距離が極めて近ければそれなりの精度で入力することができました

また、以下のように 必ずしも間違いではない部分も多く含まれています。

  • 無い→ ない
  • あと → 後
  • 何だか → なんだか

しかし、問題はここからで、以下のように明らかに間違えている部分も多く含まれています。

  • 獰悪 → 得
  • 書生 → 小生、小生、処世
  • 別段 → 別な

おおよそ正答率として計算してみると、 88%いう結果になりました。

入力精度88%は 「めちゃくちゃではないけれど、かなり間違いが多くて使いづらい」 くらいのレベル感です。

②マイクとの距離50cm

ここではマイクと口の距離を50 cm 開けて音声入力を行っています。

よく見てもらうとわかりますが、全く認識ができていないところがまだらに出てくるようになりました。

実際使っていると分かるのですが、もうここまで来るとまともに使い物にはなりません。

入力したいと思っても動かないときが3回に1回ぐらいは発生するからですね。

体感的にはほとんど手入力しているのと変わらないぐらいになってしまいます。

③マイクとの距離100 cm

もうここまで来ると全く認識できていなくなってしまったのでノーデータです。

これが安物マイクの実力です。

まぁ実際はピンマイクですので、 ここまで距離を離して使うことはないと思います。

しかし、それぐらいマイクと口との距離というのは重要なパラメータである、 ということは言えると思います。

Blue Yeti マイクの検証結果

①マイクの口との距離0cm

Blue Yeti を使って口とマイクをほぼゼロ距離で音声入力をしてみたときの結果がこちらです。

細かく見てもらえば分かると思いますが、以下のように必ずしも誤字とは言えないレベルの間違いがほとんどですね。

  • ない → ない
  • あとで → 後で
  • 何だか → なんだか

一部に以下のような間違いは見られますが、これぐらいで済むなら手入力で直すこともできますし、個人的には自動置き換えプログラムを作成して自動で修正しています。

  • 書生 → 処世

総じてとても高い音声入力の精度だと思いますね。

パーセンテージでいうと93%になりました。体感としてはもう少し高い数値(95%くらい)かなと思ったんですが、定量的に見てみると「誤字ではない間違い」が多くて、意外と低いスコアになってしまいましたね。

この辺は題材に使った文章が古い文章なので、変換の精度が悪いというところもあるかもしれません。

②マイクと口との距離50 cm

次にマイクと口の距離を50 cm 開けて測定してみた結果を示します。

すごいのが、0 cm で行ったときとほぼ精度が変わらないということですね。

個人的にさまざまな音声入力の方法を試してきましたが、 どれもマイクと口の距離というのはめちゃくちゃ大事なパラメーターであって、50 cm 離すとだんだん入力の精度が悪くなってくるものなのですが、Blue Yetiに限ってはその傾向はまったく見られません

③マイク マイクと口との距離100cm

最後にマイクと口の距離を100cmまで開けて測定してみた結果です。

見て頂いたらわかるとおり、0cm、 50 cmのときと全く制度が変わりません。

これは僕も予想していたかった驚異的な結果です。

これなら、購入したときの状態で机の端っこに置いておいても十分な精度で入力ができそうです。

(実際は、外の音ののノイズの影響を受けるので、できるだけ口の近くに置いた方がいいことは間違いないのですが…)

総じて、 Blue Yetiを使えばかなり高い精度で音声入力ができる上に、 マイクが多少離れたところにあってもかなり良い精度で入力できるということがわかりました。

注意点: Blue Yeti の弱点

ここまで褒めまくってきた Blue Yeti を使った音声入力ですが、確かに弱点は存在します。

それはマイク本体がデカくて重すぎるというところですね。

サイズとしては500mmリットルのペットボトル一本、重量は1.5キロあります。

これを持ち運んで、屋外で音声入力するというのは非現実的です。

カフェでブログを執筆している、というような方は別途ヘッドセットなどの、小型で高音質なマイクを開拓して購入する必要がありますのでご注意ください。

おわりに

今回は 安物マイクと高級マイクを比較してみて、音声入力の精度にどれぐらい差が出るのか、ということについて検証確認してみました。

その結果、やはりきちんとしたマイクを使うと、確実に音声入力の精度を改善できるということが分かりました。

なんとなく肌感覚としては気付いていたことではありますが、こうやって定量的に確認してみるとその違いがはっきり分かって良かったですね。

音声入力の世界ではまだまだ情報が不足しています。

特に日本語での音声入力は、学習データが少ないのか、まだまだ精度を上げるためにユーザーたちが工夫しないといけない状況です。

今回ご紹介したような情報が、皆様のお役に立てれば幸いです。

音声入力を使いこなせるようになると、本当に快適に執筆できるようになりますのでおすすめですよ!

皆さんもぜひマウスやキーボードのような「入力デバイスとしてのマイク」を検討してみてください。

仕事の効率が爆上げすること間違いなしですよ。

それでは良いモデリングライフを! Wak

コメント

タイトルとURLをコピーしました