
買い切りで追加費用の掛からない文字起こしソフト「RecText AI」のレビューです。オフラインで動作するため機密性の高い会議や取材録音などの文字起こしに適しています。
RecText AIについて
RecText AIはソースネクストが開発・販売する買い切り型のAI文字起こしソフトで、すべての処理をオフラインのローカル環境で完結させる点が最大の特徴です。これにより、ネットワークを介して音声データを送信する必要がなく、機密性の高い会議や取材録音などの文字起こしに適しています。
音声認識エンジンには、高精度で知られるOpenAIのWhisperをベースにした技術を採用し、日本語に特化して約92%の認識精度を実現。Windows 10/11対応のインストール型ソフトで、動画や音声ファイル、PCのマイク録音・画面録画にも対応。録音・録画中にブックマークやメモ機能が使え、重要部分の確認や議事録作成が効率的に行える。
コスト面では、9,980円の買い切りで追加課金や使用回数制限がなく、長時間の音声でも制限なく処理が可能です。これによりサブスク型の文字起こしサービスとは一線を画すコストパフォーマンスの高さを実現しています。
一方で、多言語対応や話者分離、要約機能などの高度な機能は搭載しておらず、純粋な文字起こしに特化している点も特徴です。使い勝手はシンプルながら必要な機能は一通り揃っており、明瞭で日本語のはっきりした音声の文字起こしに適したソフトです。
使い勝手と操作感

上の画像は、RecText AIを起動した画面です。シンプルなUIで左側に、ファイルから追加、録画して追加、録音して追加と並び、右上には設定と?からはオンラインマニュアルを開けます。

録画と録音では追加直後にコントロールパネルが表示されます。表示は共通で、マイク、ブックマーク、メモ、ファイル名と並んでいる。文字起こしについてはリアルタイムではなく終了後に文字起こしをするか選択してから実行されます。

録画機能は初期設定では全画面になっています。設定から「全画面で録画する」のチェックを外すと、範囲選択ができるようになる。

ファイルから追加した場合は、自動で文字起こしが実行されます。カーソルを合わせると、待機中もしくは文字起こし中となるのですが、初見では少しわかりにくい仕様だ。文字起こしにはパソコンのスペックに応じて処理速度が変わります。進行状況は青いバーで表示され、完了したら右下に通知と音で知らせてくれる。ちなみにステータスで一番上はリンク切れの表記になっているのは、ファイル名を変更したためこの表記になった。

※著作権があるのでモザイクをかけています。
文字起こしはタイムスタンプも表示され、ブックマークをするとその時間にすぐに飛べるようになる。右側にはメモ欄もありこれは自由に書き込めるもの。右上からはテキストを出力でき、時間を含めるか外すかの選択に対応する。録画したものの再生については、初期設定では画面が小さく表示されていています。ウィンドウは広げられ、画像の状態が最大画面です。ただし、この比率は保存できないようで、毎回広げなければいけないのは少し面倒だ。
処理性能について
文字起こしのスピードは、録音時間の25%~100%と処理するパソコンの性能に依存するようです。どれくらい変わるのか、最新の高性能ゲーミングノートPCと2018年に発売した7年前のノートパソコンで比較してみました。
| PCスペック | Legion Pro 7i Gen 10 Core Ultra 9 275HX メモリ32GB | dynabook UZ63/F Core i5-8250U メモリ8GGB |
| 音声時間 | 53分34秒 | 53分34秒 |
| 処理時間 | 約12分29秒 | 約48分08秒 |
| 処理速度 | 約23.3% | 約89.8% |
ファイルを追加から音声をアップロードして、手動で処理時間を計測しているので多少の時間差はあります。この結果からみても、パソコンの処理性能でかなりの違いがでるようです。ちなみに文字起こしの精度については、音声の質が大きく影響しそうで、パソコンの性能に依存はしない感じでした。
認識精度と音声の条件
RecText AIの音声認識精度は、日本語の明瞭ではっきりした音声に対して高い精度を発揮します。公式サイトでは文字起こし正解率は92.1%と公表していますが、音質が良ければその数値以上の精度を体感できました。
一方で、認識精度は話者の発音の明瞭さや録音環境の影響を大きく受けるため、様々な条件によって変動します。特に、雑音が多い環境やマイクと話者の距離が遠い場合、認識率は低下しやすくなるみたいです。また、複数人が同時に話す、方言や訛りが強い場合も誤認識が増える傾向がある。
AutoMemoと比較

※内容を公開できない非公開情報のためモザイクをかけています。
実際にオンラインイベントで録音したものを、ソースネクストで販売しているオンライン型の文字起こしAutoMemoと比較してみると違いは明らかでした。明瞭ではない音質のため認識精度は両方とも落ちるものの、RecText AIでは文字化できなかったところも、AutoMemoならそれなりに文字になっていました。いろんな場面で扱うならAutoMemoの方が段違いに優れています。
とはいえ、RecText AIは買い切り型でオフラインで無制限に使えるので、使い方次第では問題なく活躍します。
総評とおすすめポイント
実際に使ってみると、明瞭な音声で使うのならば良さそうです。追加コストがかからずに無制限で使えるのが一番の魅力かな。
メリット
- 買い切り型で追加料金不要、長期間のコストパフォーマンスに優れる
- すべての処理をオフラインで完結、ネットワークを介さないので機密情報の漏洩リスクが低い
- 明瞭な音声なら実用レベルの認識精度はある
- 録音・録画中にブックマークやメモ機能を使えて議事録作成が効率化できる
- MP4、WAV、MP3、WAVなど多様なファイル形式に対応し、PCマイク録音や画面録画も可能
デメリット
- 多言語対応なし、日本語のみ対応
- 話者分離機能や要約機能など高度な機能は搭載されていない
- ソフトはWindows専用でMacには対応していない
- 処理速度はPCのスペックに依存し、ハイエンドPCでないと高速化は難しい
おすすめの利用シーン
- 機密性の高い会議や取材音声の文字起こしで外部ネットワークに音声データを送信したくない場合
- 毎月のサブスクリプション費用を抑えたい個人・小規模事業者
- 日本語音声を主に扱うユーザーで、単純な文字起こし機能を求めている場合
- ブックマークやメモを活用しながら効率的に議事録を作りたいビジネスシーン
全体として、コスト効率、セキュリティ、基本的な文字起こし機能のバランスが良いソフトであり、特に日本語の明瞭音声を使う環境で高い効果を発揮します。高機能・多言語対応を求めるならAutoMemoとの併用がおすすめです。



コメント