こんにちは!
本日は、音声データから行う「文字起こし(テープ起こし)作業」向けオンライン(Web)アプリ「AIでカンタン文字起こし – RIMO Voice」についてです。
インタビュー記事や議事録作成に伴う文字起こし作業用に、100%完璧とまではいかないものの、「RIMO Voice」は充分に活用できるレベルに達しているサービスだと感じています。
何しろ、音声データファイルがあれば「30分の音声データを1,200円でテキスト化」できるありがたさ。しかも、録音状態さえ良ければ、かなり満足できるテキスト化精度です!
目次
Webアプリ「AIでカンタン文字起こし – RIMO Voice」は、音声起こし作業の救世主かも
音声データファイルがあれば、とりあえずは、録音した音声をテキストデータに変換することができます。
参考 AIでカンタン文字起こし - RIMO Voicehttps://rimo.app/about/voiceとにかく「文字起こしを早く終わらせたい…」と焦るほど、時間(もしくは〝けっこうなお金〟)ばかりが過ぎ去ってしまう「音声起こしという〝苦行〟」から、たぶん60〜80%程度(※当社比)は解放されます。
それが、ジブン的「AIでカンタン文字起こし – RIMO Voice(以下、RIMOと表記します)」への評価です。
そこそこ「使えるテキスト」が得られる気持ち良さ
録音状態が良い音声ファイルであれば、ほんとに「使えるテキストデータ」を得られます。AI万歳!
「状態が良い音声ファイル」からRIMOが起こすテキストデータであれば、たとえばインタビュー記事作成の場合、「音声起こし原稿(テキスト)そのもの」の納品が求められていない限り、音声起こし(テープ起こし)は終わったも同然。あとは、テキストの内容を追いながら原稿を作成していくだけです。
RIMOから吐き出されるテキストが多少おかしな文章になっていたとしても、インタビューに臨んだご本人であれば「何とかできる」と思いますので。
ちなみに、ここでいう「録音状態が良い音声ファイル」とは、話している人(話者)の声がはっきり・くっきり録音されているファイルのこと。そこに、話者の滑舌の善し悪しと話すスピードが関係してきます。
もちろん滑舌良く、普通に聞き取りやすいスピードで話してくれていれば、ますます申し分のないテキストを得られます。
「これは難しいかな…?」と思うような専門用語さえ、しっかりテキスト化されている様に出会ったうれしさ、是非ご想像ください。ですがRIMOは、地名や住所はちょっとヤバい…w
話者の語尾問題と軽減策
ただ、話者によっては「語尾がフェードアウト」する方がいらっしゃいます。そういう話し方、RIMOは「苦手」のようです。
フェードアウトする語尾のケースでは、RIMOが作成してくれるテキストも、曖昧な語尾部分からガタガタに崩れていく傾向が見られます。
そういう話し方の人からお話をうかがう際の対処法ですが、たぶんインタビューし慣れていらっしゃる皆さまでしたら、ごく普通に取り入れているであろう「オウム返し」が有効です。
インタビュアーであるジブンが、話者の話が一段落ついた時点で「◎◎ということですね!」と、声を張り気味にした〝確認の発声〟を「録音データに留めておく」ことが、RIMOでのテキスト化にも最善。インタビューとしても、次の質問に移るきっかけにしやすいですしね。
そうすることで、RIMOでは「改行(話者の交替、話題転換?)」が入ることが多いようです。ゆえに「語尾の確認」と「話題の展開ポイント確認」を同時にできて一石二鳥というわけです。
何はともあれ、「苦行先送り」を避けられるメリットが大とみた
録音状態が良くない音声データファイルを使用する場合、あるいは「音声起こし原稿(テキスト)そのものの納品」が必要となる場合には、「ひと手間」が必要となります。
ですが、「音声を聞きながら、イチから起こしていく作業に着手する」という場合に比べ、はるかに〝苦行感〟〝心理的負担感〟を減らすことができるというメリット大です。
少なくとも、音声起こし作業の「先送り回避」には絶大な効果(※当社比)があります。
Webブラウザ上でサクサク作業できるありがたさ
「ひと手間」とは、音声を聞きながら行う、RIMOが起こしてくれたテキストを修正していく作業のことです。
この作業、RIMOの〝感動ポイント〟のひとつでした。
RIMO(Webアプリ)上のテキストと音声がシンクロしているので、確認・修正したい箇所のテキスト部分に対応した音声データをすぐに再生できます。しかもWebブラウザ上で。
何が〝感動〟かというと、Webブラウザひとつで「作業ができる」ことです。何だかんだ、ほかのアプリと行ったり来たりしながらの作業はめんどうですので…。
そしてこの確認・修正作業、タイピングが超絶速い方であれば、音声を「1x(通常速度)」でダーっと再生しながら修正していけると思います。
もっとも、それができればRIMOは不要かもしれませんね…。。
音声データファイルの「音量不足」に注意
音声データファイルの「音量」は、RIMO活用上の重要な「注意点」の一つです。
アップロードし、実際にテキスト化されてみないと(課金されてみないと)「音量不足だったこと」に気づかない場合があるからです。
アップロード前には「必ず、音声ファイルの音量確認」を習慣づけたほうが良いと思います。
話者とICレコーダーなど録音機材との距離、方向や話者の声量(音圧)によっては、思いのほか「音量が低い」場合があります。そうなると、さすがのRIMOもガタ崩れ…。
もし「音声ファイルの音量が低い」場合には、下記のようなサービス(無料)で音量アップを図ってからRIMOに投入しましょう!
ちなみにですが、ジブンが活用しているICレコーダーの音声データ保存形式はMP3ファイルなので、MP3 Louderを愛用しています。
参考 オンラインでMP3の音量を上げる「MP3 Louder」(無料)https://www.mp3louder.com/jp/「外付けマイク」活用もオススメです
また、ICレコーダー利用であれば、下記のような「会議用外付けマイク」の活用も有効な手当てです。ジブンも「座談会」などの場合には、外付けマイクを活用しています。
いわゆる「全指向性マイク」または「無指向性マイク」というやつです。オンライン・ミーティングやWEB会議にも活用できるので、1台持っていて損はないと思います。
USB接続でしたら、「集音範囲5m!」の〝高感度マイク〟も探せます。
RIMOレベルのテキストなら、料金にも納得できる
RIMOを利用するには、アカウント登録が必要です。といっても、GoogleやFacebookアカウントとの連携ができるので、登録はほぼ数クリックで完了させられます。
そして料金。
この記事を書いている2021/01/25現在、次のような料金設定になっています。
動画:30円/30秒
文字起こししたいファイルごとに料金が発生。そういう意味での「スポット利用」ですね。
「30秒20円」と言われると「結構かかりそう…」なんて思うかもしれませんが、きちんと計算してみると「さほどの金額にはならない」ことが解ると思います。
たとえば30分のインタビュー音声ですと、30分(1,800秒)÷30秒×20円という計算。金額は1,200円です。
60分の「無料トライアル」がありますから、ぜひ一度試してみてはいかがでしょうか?
類似オンライン文字起こしサービスやガジェットと比べてみると
実のところジブンは、RIMOに辿り着くまでの間、さまざまな文字起こしサービスやアプリ、ガジェットを渡り歩いてしまいました。。
最も近いところでは『Auto Memo(オートメモ)』(ソースネクスト)というガジェットに手を出し…
Auto Memo(オートメモ)は、今後の進化に期待しています
オートメモ(Auto Memo)入手経緯と使用感など「ことの顛末」は、別途記事にてご紹介させていただこうと思います。
オートメモ(Auto Memo)とは、ソースネクストから2020年12月に発売されたばかりの製品。結論から言うと、「今後の進化に大いに期待!」というところでしょうか。
ただ、オートメモ(Auto Memo)の「ICレコーダーと自動文字起こしが合体」というスタイル、機動力を活かしたい取材や執筆スタイルのほか、ガジェット活用満足度wwとしては、捨てがたい魅力があります。だからこそ「うっかり手を出してしまった…」わけです。
「今後の進化に大いに期待」に留まる原因としては、概ね次の点です。
・スマホとWi-Fiが必須であること
・RIMOのように「Webブラウザで完結」させられない作業フロー
・AIによるテキスト化の精度がまだ不足していること(学習データ不足?)
・作成されるテキストに「改行」が一切無い(※ここが一番の不満点かな…)
他の類似オンライン文字起こしサービスの場合
インストール型アプリの使用経験はありませんが、Web上の文字起こし類似サービスなら、いくつか試したことがあります。
これまでに試したRIMO類似サービスの場合、何といっても「テキスト化精度の残念さ」と「テキスト化のクセが強い」というところが、ジブン的ネックだと感じていました。
だって、エロ系用語やスラング、ゲーム系フレーズが散りばめられたテキストを「チマチマと修正」したくはないですよね!?
ゆえに「まだまだ自動化にはほど遠いのかな…」「もう少しまともな辞書(学習データ)は無いのかな」「このレベルのテキストにお金を使うのはもったいない…」などと、落胆の日々を重ねてしまった次第なわけです。。
人力文字起こしサービスの場合は
また、止むに止まれず「人力サービス」利用経験も何度か。
こちらは、さすがに「仕上がりへの不満」は全くありませんでしたが、いかんせん「どうかすると数万円単位となる費用の問題」がつきまとうわけでして。
「テープ起こし外注費」を予め予算化し、該当案件の見積に載せておけば済むように思われるかもしれませんが、クリエイティブ系の見積とは「値切られるために存在する…」ことに加え、お仕事オーダーをいただいく際の「長くて15分くらいのインタビュー原稿ですから!」は、結果的に「平気で2倍3倍に延びるものである」という現実世界の不思議、そしてオトナの事情から、満額予算実現はなかなか難しいという。。
…これ以上は愚痴になってしまいそうなので、今日はこの辺で。。
現場からは以上です。
まとめ|「RIMO Voice」「Auto Memo」はどんな人・場面に向いているか
と、ここまで書きながら思い浮かんだことを「今回のまとめ」として。
どんな人、どんなシーン(場面)で「RIMO Voice」または「Auto Memo」を使い分けるべきか。そこの見極めが大事かもしれません。また、日常的に「使い倒す」としたら、掛かる費用面も検討する必要があります。
この記事では詳しくは記しませんが、「Auto Memo」を使い続けていくためには、月額サブスク料金またはスポット料金いずれかの支払いが必要となります。
費用面はとりあえず置いておきですが、たとえば「こんな使い分け方」はいかがでしょう。
しかしまぁ、常識的というか仕事に使うなら、今はまだ「RIMO Voice」なのかも…。
いや、決して「Auto Memo」をディスるわけではなく…。何しろジブンも所有していますので、更なる進化を期待しているわけでして。「Auto Memo」は、大きな魅力と可能性をはらんだガジェットだと思っています!
「RIMO Voice」が向いている人・場面
・愛用中のICレコーダーなどの録音機材が、既に手もとにある場合
・PCやMac上での作業がメインとなっている人
・数分以上に及ぶ音声データをテキスト化することが多い場合
・録音内容を可能な限り正確にトレースしたい場合
・後工程では、なるべく手間を掛けたくない場合
「Auto Memo」が向いている人・場面
・ICレコーダーなどの録音機材購入を考えている場合
・スマホで〝あれこれすること〟がメインという人
・音声メモなどの短文をテキスト化したいと考えている場合
・断片的であっても、雰囲気やキーワードさえ確認できれば問題ないという場合
・後工程の手間や作業は覚悟のうえ、とにかく「片っ端からテキスト化」という機動力が必要とされる場合