音声入力ソフトの選び方&高精度でお手頃な音声入力ソフトの紹介

 この記事は音声入力を個人で利用す場合など機密情報を取り扱わない範囲で音声入力を利用したい方に向けたものです。
またGoogle の音声認識を利用した高精度で無料またはお手頃価格の音声入力ソフトもいくつか紹介しています

 音声入力ソフトは無料で利用できるものから10万円以上するものものもありますが、音声入力ソフトは無料あるいは低価格だから音声認識の精度が悪いというわけではありません。

 キーボード入力の代わりにマイクに話して音声入力をしたいというだけであれば、無料またはお手頃価格の音声入力ソフトで十分という場合も多いと思います。

 音声入力ソフトを試してみたいけど「高額な音声入力ソフトはちょっと・・・」と思っている方はこの記事をぜひ読んでみてください。

音声認識におけるセキュリティについて

 まず最初に確認すべきなのは「音声入力する内容・利用する状況」についてです。具体的には「ビジネス利用か?個人利用か?」また「機密情報の有無」などになります。

 クラウド型(インターネットを経由するタイプ)の音声認識サービスを使用する場合は事前にその音声認識における音声データの取り扱いやプライバシーについて確認する必要があります。
 ユーザーのプライバシーに配慮してる音声入力ソフト・サービスは価格及び利用料金が個人で利用するには高めに設定されているものも多くなっています。中にはMicrosoft Edge の音声認識(Web Speech API)のようにクラウド型の音声認識で無料で利用できるけれど、十分にユーザーのプライバシーに配慮されているものもあります。

1.機密情報を取り扱う場合
 機密情報を取り扱う場合、一番いいのは音声データをインターネットに送信しない音声入力ソフトになります。インターネットを介して音声認識をする場合は、音声認識サービスを提供している企業またはその関係者が音声データを確認できないような音声認識サービス・プランを選択するべきです。
有料のクラウド型の音声認識サービスの場合、音声データのログを残すかどうかによっても利用料金が変わってくる場合もあります。ビジネスでの利用を想定した音声入力ソフト・サービスをいくつか挙げると、
・Google CloudのSpeech-to-Text
・Microsoft Azureの Speech to Text
・株式会社アドバンスト・メディアのAmiVoice(クラウド型とスタンドアローン型があります)
・IBM Watson の Speech-to-Text
・Amazon Transcribe

などがあります。APIの形で提供される音声認識サービスは、実際に使用する状況に応じて音声認識システムを構築できるようになっています。

2.機密情報取り扱わない場合
 個人で音声入力を利用するような場合などで特に機密情報を取り扱わない場合はGoogle Chromeの音声認識を利用したソフトがおすすめです。理由は、その多くは価格が無料もしくはお手頃価格で音声認識の精度がとても良いためです。いくつかあげると、
・Google ドキュメントの音声入力(無料で利用できます)
・話してパソコン via the Web(任意のアプリに直接音声入力できます)
・Voice Rep 3(専用のエディターへ音声入力するソフト)
・Voice Rep 3 ProVoice Rep 3 の上位版。音声ファイルの文字起こしが可能)
・Voice Code(クリップボードを利用した汎用タイプの音声入力ソフト)
・VoiceIn(Google Chrome 用の音声入力アプリ)
・どこでも音声認識(Google Chrome 用の音声入力アプリ)
・Excel聞き取り上手(Excel 用の音声入力ソフト)
などがあります。
いずれもGoogle の音声認識を利用しているため音声認識の精度は同等程度に高いと思われます。

音声認識の精度について

 音声認識の精度に関しては一般的に使用されるような単語や言葉をマイクに話して音声入力するのであればで、Google の音声認識を利用した無料またはお手頃な価格のソフトで十分だと思います。手頃に利用できるGoogle 音声認識でもある程度は専門用語もちゃんと音声を文字に変換してくれます。
他の色々な音声認識ソフトを試したほうがいいと思われる場合は以下のようなケースです。

1.業界特有の専門用語の音声認識する場合:
 専門用語については、AmiVoiceのように使用するユーザーの分野によってサービスを分けているものもあります。特殊な用語を多く使うような場合は、登録されている語句が多いものを使うと良いでしょう。

2.音声ファイルの文字起こしをする場合
 音声ファイルの文字起こしをする場合は、Google ドキュメントの音声認識などリアルタイムで音声認識をするタイプのソフトでもある程度は音声認識することができますが、音声ファイルの文字起こしのための音声認識エンジンを利用したサービス・ソフトが有利になると思います。
その理由の一つは、文字起こしのための音声認識エンジンの場合は音声ファイル全体の文脈中で音声を文字に変換することができるということがあります。
 ユーザーが話した音声をリアルタイムで音声認識するタイプのソフトは再生している音声が途切れるたびに音声認識の結果が確定します。そのため音声ファイル全体の文脈の中で音声を文字に変換するということは基本的にはできません。

3.話してる人を認識(識別)したい場合
 会議などの議事録を作成する場合などで、誰が話しているかを識別したい場合は議事録作成用の音声認識サービスを利用した方が良いでしょう。

ソフトの使いやすさについて

 次に実際に使用する状況によって合うソフト、合わないソフトがあるため、ソフトを選ぶ際のポイントをあげたいと思います。

1.音声入力先のアプリケーション
 まずは入力先のアプリケーションについてです。音声入力ソフトによっては特定のアプリケーションにしか音声入力できないものもあります。例えばGoogle ドキュメントの音声認識はGoogle ドキュメントにしか音声入力できません。
またすでに入力されている文書を修正する場合に、修正したい部分をピンポイントで修正できるかも確認した方が良いと思います。

2.キーボード操作と併用できるか
 音声認識中にキーボードが使えないソフトの場合は、そのつど音声認識のオンオフを切り替える必要が出てきます。音声入力とキーボード入力を併用できる方が使い勝手は良いと思います。

3.辞書機能、認識結果の補正機能の有無
 次に音声認識した結果を補正する機能があるかどうかも確認してみてください。音声認識精度に十分満足している場合は、必ずしも必要なものではないかもしれませんが、毎回違う言葉で音声認識される場合、メールアドレスなど音声認識が難しい内容を入力するには便利な機能です。また句読点などの記号を音声入力する場合に利用できることもあります。

4.周りに人がいる状況での使用について
 周りに人がいる状況で大きな声で音声入力をすることはためらわれます。ただ最近はテレワークが普及しているということもありヘッドセットを着用していれば一人で話してもそんなに不自然ではないと思います。
ヘッドセットなどの口元付近で使用するマイクを使ってある程度小さい声で話した場合に音声認識が正確に行われるかどうかも確認した方が良いと思います。
 また周りに人がいて会話する必要がある場合は音声認識した結果が全て入力されては困るという場合もあります。音声入力のオンオフをすぐに行えるかどうかも重要な要素になります。

最後に・・・「試してもらいたいソフト」

 最後に筆者が作成した音声入力ソフトを紹介させてください。このソフトはまだ公開されてからあまり時間がたっておらず、使用してくれている人はまだ多くありませんが、実際に使用している人はとても気に入ってくれています。また意見や要望をいただければ次回のアップデート時の参考にさせていただきたいと思います。


 「話してパソコン入力 via the Web」「文字を入力するあらゆるケース」で利用できる音声入力ソフトを作りたいと思い作成したソフトです。音声認識にはGoogle またはMicrosoft Edge のWeb Speech APIを利用しており(選択可能)音声認識の精度はとても高いです。
 このソフトは少しずつ改良して現在は「うっかり話した内容を入力したくないとき」や、「周りの人と会話をしながら音声入力をしたい」というような状況にも対応できるようになっています。
バージョン3からは音声認識のオンオフの操作性についても改善しています。

 キーボードの代わりに音声で文字を入力したいという要望に対しては十分こたえることができるソフトになっております。
価格は2500円とお手頃価格で、また30日間は有料版と同じ機能が無料で使用できます。
30日経過した後にこちらから利用料金を請求する事はありません。ソフトがいらなくなった場合はダウンロードしたファイルおよびフォルダを削除するだけで大丈夫です。

ソフトは下のベクターへのリンクからダウンロードできます。

話してパソコン入力 via the Webの詳細情報 : Vector ソフトを探す!
Googleの音声認識を利用して直接Windowsの任意のアプリに音声入力できる 操作も簡単

「話してパソコン入力 via the Web」 を紹介しているページ読む方はこちらからどうぞ

タイトルとURLをコピーしました