kiharay2021年5月26日Teams会議のリアルタイム音声処理を調べてみた 調査編前回の記事 Teams会議から音声をリアルタイムに取得するための背景や基本情報は下記の記事にまとまっています。ここでは、Microsoftのドキュメントから「アプリケーションホスト型メディア」を中心に紹介します。 アプリケーションホスト型メディアって?...
kiharay2021年5月10日Teams会議のリアルタイム音声処理を調べてみた 導入編DXの役に立ちそうな音声データに注目してみた 音声の取り扱いってドキュメントがなくて、Microsoftのドキュメントを探し当てるのも苦労したので、ここで日本語でまとめて紹介します。執筆時点(2021年5月)の情報を元にしています。 リアルタイム音声処理で新しいユーザ体験...
nakaji2021年4月18日[C#] Azure Cognitive Service で日本語音声の文字起こしTLDR(要約) 複数人が話している音声ファイルから、話者を区別してテキスト変換するプログラムを作成 音声ファイルの形式がけっこう制約ありなので、変換などの前処理が必要 文字起こしの精度は良好だが、話者の区別は精度に課題があり...