ItumoVoiceのQ＆A

Microsoft Defenderに対してItuomoVoiceを許可する方法をこのページに追記しました。2024/8/14

2024/7/25の朝以降ItumoVoiceがWindows DefenderやMicrosoft Defenderにマルウェア（trojan:MSIL/ClipBanker.CP!MTB）として誤検知されるようになりました。
ウィルスバスタークラウドでスキャンした場合はセキュリティ上の脅威は検出されません。
2024/7/27 にMicrosoft Defenderにマルウェアとして誤検知される箇所を特定できました。
Microsoft Defenderがマルウェアとして誤検知していた箇所は以下の2点です。
１．音声入力したい内容がクリップボードにセットされたか確認する処理
２．クリップボード経由で音声入力する際にクリップボードの中身を確認する処理（音声入力後にクリップボードの状態を戻すために）
いずれもセキュリティ上の脅威にはなり得ないのでMicrosoft Defenderの誤検知になります。
この誤検知の問題が起こる対象のバージョンはItumoVoice Ver.1.1.0～2.1.0になります。

上記のMicrosoft Defenderにマルウェアとして誤検知される問題に対してマルウェアとして誤検知されないように変更したバージョンのItumoVoice Ver.2.1.1sがベクターからも公開されました。ItumoVoice Ver.2.1.1sのダウンロードはこちらからダウンロードできます（2024/7/31）。

質問：Microsoft Defenderに悪意のあるソフトとして誤検知されます。ItumoVoiceを許可する事はできますか？
質問：ItumoVoiceは.NET 8でも使用できますか？
質問：Ver.2.1.0で追加された音声認識ON/OFF変更時の効果音をオフにできますか。
質問：入力時のIME入力モード切替＆入力方法とは何でしょうか？
質問：オフラインで音声入力できることによるメリット・デメリットは何ですか？
質問：同じ日本語の音声認識モデルでも小型のモデルと大型のモデルがありますが違いはなんですか？
質問：ItumoVoiceはVoskで音声認識した結果をそのまま入力しますか？（特に漢数字など）
質問：ItumoVoiceを購入する方法を教えて下さい。

質問：Microsoft Defenderに悪意のあるソフトとして誤検知されます。ItumoVoiceを許可する事はできますか？

下記の手順でSokki Voice.exeの動作を許可する事ができるので試してみて下さい。

①：Windowsの[設定]-[更新とセキュリティ]- [Windows セキュリティ]-[ウィルスと脅威の防止]で見つかった脅威を一旦許可します。（最後にまた許可しないように戻します）
※まだItumoVoiceが脅威として検出されていない場合は手順①は不要です。

②：Windowsの[設定]-[更新とセキュリティ]- [Windows セキュリティ]-[ウィルスと脅威の防止]-[ウィルスと脅威の防止の設定]-[設定の管理]をクリックします

③：[除外]-[除外の追加]をクリックします。

④：下記の「除外の追加」でファイルを選択します

⑤：「ItumoVoice.exe」を選択して「開く(O)」ボタンをクリックして下さい。引き続き手順④からの方法で同様に「ItumoVoice.dll」を除外する項目に追加して下さい。

⑥：手順①で許可した脅威を許可しないように戻します。
Windowsの[設定]-[更新とセキュリティ]- [Windows セキュリティ]-[ウィルスと脅威の防止]で許可した脅威を許可しないようにして下さい。

以上でItumoVoiceをMicrosoft Defenderに対して許可する設定は完了です。

質問：ItumoVoiceは.NET 8でも使用できますか？

~~ItumoVoiceは、.NET 8 (.NET Desktop Runtime )で使用することができます。~~
2024年5月29日に公開された ItumoVoice Ver.2.1.0以降のバージョンは.NET 8（.NET Desktop Runtime）で使用する事ができます。

※ItumoVoice Ver.2.0.1までは.NET8では利用できません。また .NET 6のサポートが2024年11月8日までになりますので、最新版のItumoVoiceへのアップデートをご検討下さい。

質問：Ver.2.1.0で追加された音声認識ON/OFF変更時の効果音をオフにできますか。

詳細設定画面の「音声認識のON/OFFの変更を音で通知する」のチェックを外す事でオフにできます。

質問：入力時のIME入力モード切替＆入力方法とは何でしょうか？

　下記設定項目の上４つの項目（クリップボードから入力以外）はキーボードインターフェースでの音声入力になります。

　上の２つの設定はIMEの入力モードが「直接入力」以外の時に音声認識結果がIMEによって変換されて正しく入力されない時のための機能です。まずは「入力時：直接入力⇒入力後：元のモード（切替方法 B）」を選択してみてください。
※Microsoft IME を使用する場合は（切替方法 A）を推奨。

あえてIME（ATOK等）を利用して音声入力したい場合は「入力モードを切り替えない」を選択してみてください。

上４つの設定でいずれも入力出来ないアプリに対しては「クリップボードから入力（入力モ
ードは切り替えない）」を選択してみて下さい。

質問：オフラインで音声入力できることによるメリット・デメリットは何ですか？

メリット：

外出先などインターネットに接続できない環境においても音声入力することができます。
音声データがインターネットに送信されないため情報漏洩のためのリスクを最小に抑えることができます。

デメリット：

　大きいサイズの音声認識モデルを使用する場合、メモリーを多く使用する等の理由で使用するPCにある程度のスペックが要求されます。

質問：同じ日本語の音声認識モデルでも小型のモデルと大型のモデルがありますが違いはなんですか？

　大型の音声認識モデルは汎用型の音声認識モデルで文章の作成などに利用する事に向いています。
一方で小型型の音声認識モデルは特定の音声認識結果に対してそれに応じた処理をさせるような限定的な使い方に向いています（音声コマンドなど）。
小型のモデルに比べると大型の音声認識モデルの方が変換精度は良くなりますが、一方で使用するメモリーの量が多くなるのと、音声認識結果が確定するまでの時間が少し遅くなります。

質問：ItumoVoiceはVoskで音声認識した結果をそのまま入力しますか？（特に漢数字など）

いいえ、ItumoVoiceはVoskで音声認識した結果を必要に応じて変換してから入力します。

　変換処理については、ユーザーが設定できる「補正テーブル」、「キーワード入力」、
「英数字入力の半角/全角」の他に、ItumoVoiceオリジナルの補正処理を行なっています。

ItumoVoiceオリジナルの補正処理は、必要に応じて漢数字をアラビア数字に変換したり、全角のアルファベットを半角に変換したり、カタカナをアルファベットに変換するなどしています。

※Voskは「1523」を「千五百二十三」のように認識するのでItumoVoiceで「千五百二十三」→「1523」のように変換しています。
※漢数字をアラビア数字に変換する過程において、一部本来であれば漢数字で入力されべきところがアラビア数字で入力されるというようなことがあります。
この点については今後のアップデートで随時見直していきますが、さしあたっては補正テーブルで意図した結果が入力されるように設定してみてください。（例：補正前「1方で」→補正後「一方で」）

質問：ItumoVoiceを購入する方法を教えて下さい。

ソフト価格：使用するPC１台につき 3000円（手数料・消費税込み）

購入を希望する方は下記のリンクよりベクターのシェアレジサービスをご利用ください。
https://www.vector.co.jp/soft/dl/winnt/writing/se525781.html

※シェアレジサービスを利用してお支払いできない場合はこちらよりお問い合わせください。