
今年はOpenAIの音声テキスト変換エンジン「Whisper」をいろいろ試してきました。Whisperは完璧ではありませんが、非常に優れた機能で、書き起こしの作成にかかる労力とコストを大幅に削減してくれます。
Whisperを使った文字起こし専用のアプリとしては、Jordi BrunのMacWhisperやFerriteのメーカーによるTranscriptionistなどがあり、どちらも試してみました。しかし、今のところ最も有望なのは、Rogue AmoebaがAudio Hijackの一部として本日リリースした新しいTranscribeブロックです。
この新しいブロックはベータ版の機能で、Rogue Amoebaのポール・カファシス氏によると、同社は今後も改良を続けていくとのことです。他のアプリと同じWhisperテクノロジーを基盤として採用していますが、既存の録音フローの一部として文字起こしを簡素化することで、録音中に即座に文字起こしを行い、別のチャンネルから音声が来ている話者を識別することが可能になります。
今日は番組の録音がなかったので、新機能をテストするために、MacStories Unwindの録音セッションをコピーし、Zoomのオーディオ設定をフェデリコの代わりとして使いました。自分のマイクに向かって話す音声を片方の音源として使い、Zoomの設定からピアノの音をもう片方の音源として使いました。Audio Hijackは両方の音声を録音し、録音中に文字起こしを開始しました。結果は以下の通りです。
これは非常に限定的なテストでした。より長時間の録音セッションでアプリがどのように機能するかはまだ分かりませんが、設定の簡単さに期待しています。Transcribeブロックに入力したソースの名前を変更することで、タイムスタンプと私たちの名前が付いたリアルタイムのトランスクリプトを作成できました。
結果がいかに素晴らしいものであっても、Audio Hijackで録音したものは公開しません。編集が必要なため、その時点でこのセッションで作成されたトランスクリプトは公開された音声と異なるものになってしまうからです。とはいえ、最近リリースされたベータ版の機能としては感銘を受けており、Rogue Amoebaが今後どのように進化していくのか楽しみにしています。
追加コンテンツと特典にアクセスする
Club MacStories は 2015 年に設立され、ほぼ 10 年間にわたって毎週独占コンテンツを提供してきました。
毎週、毎月の電子メール ニュースレターから始まったものが、すべての MacStories ファン向けに設計されたメンバーシップ ファミリーに成長しました。
詳細については、こちらおよびクラブの FAQ をご覧ください。
Club MacStories : アプリ、ヒント、自動化ワークフロー、長文執筆、MacStories Unwind ポッドキャストへの早期アクセス、定期的な景品など、盛りだくさんの情報を満載した、電子メールと Web 経由の週刊および月刊ニュースレター。
Club MacStories+ : Club MacStories が提供するすべての機能に加え、アクティブな Discord コミュニティ、クラブの過去のカタログ全体を閲覧するための高度な検索機能とカスタム RSS 機能、ボーナス コラム、多数のアプリ割引などが含まれます。
Club Premier : 上記のすべてに加え、早期に、広告なしで、高ビットレートのオーディオで配信される当社の主力ポッドキャストの拡張バージョンである AppStories+ が含まれます。