MoreBeerMorePower

Power Platform中心だけど、ノーコード/ローコード系を書いてます。

iOSのボイスメモからノーコードでSpeech to Text

前回作成したLogic Appsでは、オーディオフォーマットの変換とAzure Speechサービスを使ったSpeech to Textを実行しているのですが、入力・返却は通常のJSONでやり取りするので他のサービスからも実行可能です。

mofumofupower.hatenablog.com

ここでは、iOSのボイスメモを文字起こしのソースにするために、ショートカットアプリを利用してみました。対面のミーティングとかやっていたころは結構ボイスメモで議論を録音していたりしたので、使えるかも?

iPhone/iPad上では、ボイスメモを開き、対象の録音を選んでメニューから作成したショートカットを選択するだけです。

f:id:mofumofu_dance:20201213140953p:plain

iOS ショートカットの構成

iOS ショートカットの構成も単純です。ロジック部分はすべてLogic Appsに押し付けているので、ショートカットではボイスメモのデータから必要なJSONを作成して、送った結果を表示するだけ。

f:id:mofumofu_dance:20201213141803p:plain

特に難しいところもないのですが、1点、iOSのボイスメモがm4a形式だというところだけ、DataURIを作るときに注意が必要です。 ショートカットのメニューで得られるのはbase64文字列なので、コンテンツタイプを追加するために

data:audio/x-m4a;base64,

これを追加しています。

おわり

Logic Apps側でもサービスを呼び出しているだけなので、ショートカット上だけで処理を完結させることももちろん可能ですが、変換処理部分を切り離しておけばほかのショートカット/アプリからも手軽に呼び出せるので汎用性が高くなります。

あとはショートカットでがりがり作っていくの結構大変なのも・・・😅

ショートカット活用のためのPower Automate/Logic Apps ぜひ試しに作ってみてはいかがでしょうか。

↓ほかにも色々応用できそうです。

qiita.com