ItumoVoiceのQ&A

質問:ItumoVoiceは.NET 8でも使用できますか?

ItumoVoiceは、.NET 8 (.NET Desktop Runtime )で使用することができます。
2024年4月24日時点の最新版 ItumoVoice Ver.2.0.1は.NET 8では利用できません。.NET 8 版のItumoVoiceは今後公開する予定です。

※ .NET 6のサポートが2024年11月8日までになるため、その3ヶ月前までには.NET 8版のItumoVoiceを公開する予定です。

質問:入力時のIME入力モード切替&入力方法とは何でしょうか?

 下記設定項目の上4つの項目(クリップボードから入力以外)はキーボードインターフェースでの音声入力になります。

 上の2つの設定はIMEの入力モードが「直接入力」以外の時に音声認識結果がIMEによって変換されて正しく入力されない時のための機能です。まずは「入力時:直接入力⇒入力後:元のモード(切替方法 B)」を選択してみてください。
※Microsoft IME を使用する場合は(切替方法 A)を推奨。

あえてIME(ATOK等)を利用して音声入力したい場合は「入力モードを切り替えない」を選択してみてください。

上4つの設定でいずれも入力出来ないアプリに対しては「クリップボードから入力(入力モ
ードは切り替えない)」を選択してみて下さい。

質問:オフラインで音声入力できることによるメリット・デメリットは何ですか?

メリット:

  1. 外出先などインターネットに接続できない環境においても音声入力することができます。
  2. 音声データがインターネットに送信されないため情報漏洩のためのリスクを最小に抑えることができます。

デメリット:

 大きいサイズの音声認識モデルを使用する場合、メモリーを多く使用する等の理由で使用するPCにある程度のスペックが要求されます。

質問:同じ日本語の音声認識モデルでも小型のモデルと大型のモデルがありますが違いはなんですか?

 大型の音声認識モデルは汎用型の音声認識モデルで文章の作成などに利用する事に向いています。
一方で小型型の音声認識モデルは特定の音声認識結果に対してそれに応じた処理をさせるような限定的な使い方に向いています(音声コマンドなど)。
小型のモデルに比べると大型の音声認識モデルの方が変換精度は良くなりますが、一方で使用するメモリーの量が多くなるのと、音声認識結果が確定するまでの時間が少し遅くなります。

質問:ItumoVoiceはVoskで音声認識した結果をそのまま入力しますか?(特に漢数字など)

いいえ、ItumoVoiceはVoskで音声認識した結果を必要に応じて変換してから入力します。

 変換処理については、ユーザーが設定できる「補正テーブル」、「キーワード入力」、
「英数字入力の半角/全角」の他に、ItumoVoiceオリジナルの補正処理を行なっています。

ItumoVoiceオリジナルの補正処理は、必要に応じて漢数字をアラビア数字に変換したり、全角のアルファベットを半角に変換したり、カタカナをアルファベットに変換するなどしています。

※Voskは「1523」を「千五百二十三」のように認識するのでItumoVoiceで「千五百二十三」→「1523」のように変換しています。
※漢数字をアラビア数字に変換する過程において、一部本来であれば漢数字で入力されべきところがアラビア数字で入力されるというようなことがあります。
この点については今後のアップデートで随時見直していきますが、さしあたっては補正テーブルで意図した結果が入力されるように設定してみてください。(例:補正前「1方で」→補正後「一方で」)

質問:ItumoVoiceを購入する方法を教えて下さい。

ソフト価格:使用するPC1台につき 3000円 (手数料・消費税込み)

購入を希望する方は下記のリンクよりベクターのシェアレジサービスをご利用ください。
https://www.vector.co.jp/soft/dl/winnt/writing/se525781.html

※シェアレジサービスを利用してお支払いできない場合はこちらよりお問い合わせください。

タイトルとURLをコピーしました