RecText AIレビュー！買い切りでオフライン動作する文字起こしソフト

買い切りで追加費用の掛からない文字起こしソフト「RecText AI」のレビューです。オフラインで動作するため機密性の高い会議や取材録音などの文字起こしに適しています。

RecText AIについて
使い勝手と操作感
処理性能について
認識精度と音声の条件
1. AutoMemoと比較
総評とおすすめポイント

RecText AIについて

Amazonで「RecText AI」に関する詳細を見る

RecText AIはソースネクストが開発・販売する買い切り型のAI文字起こしソフトで、すべての処理をオフラインのローカル環境で完結させる点が最大の特徴です。これにより、ネットワークを介して音声データを送信する必要がなく、機密性の高い会議や取材録音などの文字起こしに適しています。

音声認識エンジンには、高精度で知られるOpenAIのWhisperをベースにした技術を採用し、日本語に特化して約92%の認識精度を実現。Windows 10/11対応のインストール型ソフトで、動画や音声ファイル、PCのマイク録音・画面録画にも対応。録音・録画中にブックマークやメモ機能が使え、重要部分の確認や議事録作成が効率的に行える。

コスト面では、9,980円の買い切りで追加課金や使用回数制限がなく、長時間の音声でも制限なく処理が可能です。これによりサブスク型の文字起こしサービスとは一線を画すコストパフォーマンスの高さを実現しています。

一方で、多言語対応や話者分離、要約機能などの高度な機能は搭載しておらず、純粋な文字起こしに特化している点も特徴です。使い勝手はシンプルながら必要な機能は一通り揃っており、明瞭で日本語のはっきりした音声の文字起こしに適したソフトです。

使い勝手と操作感

上の画像は、RecText AIを起動した画面です。シンプルなUIで左側に、ファイルから追加、録画して追加、録音して追加と並び、右上には設定と？からはオンラインマニュアルを開けます。

録画と録音では追加直後にコントロールパネルが表示されます。表示は共通で、マイク、ブックマーク、メモ、ファイル名と並んでいる。文字起こしについてはリアルタイムではなく終了後に文字起こしをするか選択してから実行されます。

録画機能は初期設定では全画面になっています。設定から「全画面で録画する」のチェックを外すと、範囲選択ができるようになる。

ファイルから追加した場合は、自動で文字起こしが実行されます。カーソルを合わせると、待機中もしくは文字起こし中となるのですが、初見では少しわかりにくい仕様だ。文字起こしにはパソコンのスペックに応じて処理速度が変わります。進行状況は青いバーで表示され、完了したら右下に通知と音で知らせてくれる。ちなみにステータスで一番上はリンク切れの表記になっているのは、ファイル名を変更したためこの表記になった。

※著作権があるのでモザイクをかけています。

文字起こしはタイムスタンプも表示され、ブックマークをするとその時間にすぐに飛べるようになる。右側にはメモ欄もありこれは自由に書き込めるもの。右上からはテキストを出力でき、時間を含めるか外すかの選択に対応する。録画したものの再生については、初期設定では画面が小さく表示されていています。ウィンドウは広げられ、画像の状態が最大画面です。ただし、この比率は保存できないようで、毎回広げなければいけないのは少し面倒だ。

処理性能について

文字起こしのスピードは、録音時間の25％～100％と処理するパソコンの性能に依存するようです。どれくらい変わるのか、最新の高性能ゲーミングノートPCと2018年に発売した7年前のノートパソコンで比較してみました。

PCスペック	Legion Pro 7i Gen 10 Core Ultra 9 275HX メモリ32GB	dynabook UZ63/F Core i5-8250U メモリ8GGB
音声時間	53分34秒	53分34秒
処理時間	約12分29秒	約48分08秒
処理速度	約23.3％	約89.8％

ファイルを追加から音声をアップロードして、手動で処理時間を計測しているので多少の時間差はあります。この結果からみても、パソコンの処理性能でかなりの違いがでるようです。ちなみに文字起こしの精度については、音声の質が大きく影響しそうで、パソコンの性能に依存はしない感じでした。

認識精度と音声の条件

RecText AIの音声認識精度は、日本語の明瞭ではっきりした音声に対して高い精度を発揮します。公式サイトでは文字起こし正解率は92.1％と公表していますが、音質が良ければその数値以上の精度を体感できました。

一方で、認識精度は話者の発音の明瞭さや録音環境の影響を大きく受けるため、様々な条件によって変動します。特に、雑音が多い環境やマイクと話者の距離が遠い場合、認識率は低下しやすくなるみたいです。また、複数人が同時に話す、方言や訛りが強い場合も誤認識が増える傾向がある。

AutoMemoと比較

※内容を公開できない非公開情報のためモザイクをかけています。

実際にオンラインイベントで録音したものを、ソースネクストで販売しているオンライン型の文字起こしAutoMemoと比較してみると違いは明らかでした。明瞭ではない音質のため認識精度は両方とも落ちるものの、RecText AIでは文字化できなかったところも、AutoMemoならそれなりに文字になっていました。いろんな場面で扱うならAutoMemoの方が段違いに優れています。

とはいえ、RecText AIは買い切り型でオフラインで無制限に使えるので、使い方次第では問題なく活躍します。

総評とおすすめポイント

実際に使ってみると、明瞭な音声で使うのならば良さそうです。追加コストがかからずに無制限で使えるのが一番の魅力かな。

メリット

買い切り型で追加料金不要、長期間のコストパフォーマンスに優れる
すべての処理をオフラインで完結、ネットワークを介さないので機密情報の漏洩リスクが低い
明瞭な音声なら実用レベルの認識精度はある
録音・録画中にブックマークやメモ機能を使えて議事録作成が効率化できる
MP4、WAV、MP3、WAVなど多様なファイル形式に対応し、PCマイク録音や画面録画も可能

デメリット

多言語対応なし、日本語のみ対応
話者分離機能や要約機能など高度な機能は搭載されていない
ソフトはWindows専用でMacには対応していない
処理速度はPCのスペックに依存し、ハイエンドPCでないと高速化は難しい