前回作成したLogic Appsでは、オーディオフォーマットの変換とAzure Speechサービスを使ったSpeech to Textを実行しているのですが、入力・返却は通常のJSONでやり取りするので他のサービスからも実行可能です。
ここでは、iOSのボイスメモを文字起こしのソースにするために、ショートカットアプリを利用してみました。対面のミーティングとかやっていたころは結構ボイスメモで議論を録音していたりしたので、使えるかも?
iOSのVoiceMemoから、#Shortcuts と #LogicApps を使って文字起こしやってみました!(音あり注意) pic.twitter.com/gcTpgEFQku
— Hiro (@mofumofu_dance) 2020年12月11日
iPhone/iPad上では、ボイスメモを開き、対象の録音を選んでメニューから作成したショートカットを選択するだけです。
iOS ショートカットの構成
iOS ショートカットの構成も単純です。ロジック部分はすべてLogic Appsに押し付けているので、ショートカットではボイスメモのデータから必要なJSONを作成して、送った結果を表示するだけ。
特に難しいところもないのですが、1点、iOSのボイスメモがm4a形式だというところだけ、DataURIを作るときに注意が必要です。 ショートカットのメニューで得られるのはbase64文字列なので、コンテンツタイプを追加するために
data:audio/x-m4a;base64,
これを追加しています。
おわり
Logic Apps側でもサービスを呼び出しているだけなので、ショートカット上だけで処理を完結させることももちろん可能ですが、変換処理部分を切り離しておけばほかのショートカット/アプリからも手軽に呼び出せるので汎用性が高くなります。
あとはショートカットでがりがり作っていくの結構大変なのも・・・😅
ショートカット活用のためのPower Automate/Logic Apps ぜひ試しに作ってみてはいかがでしょうか。
↓ほかにも色々応用できそうです。