音声認識API オプション機能
最終更新日:2022/02/16
このページを印刷話者ごとに発話区間を推定
アドバンスト・メディアは、音声認識API「AmiVoice Cloud Platform」において、複数の話者が含まれる音声に対して、誰がいつ話したのか話者ごとに発話区間を推定する技術「話者ダイアライゼーション」の無料オプション提供を開始。音声認識のリクエスト時にdパラメータに設定を行うだけで、音声認識の結果に推定された話者情報を含むことができる。独自開発の音響モデルを用いて、事前学習なしで音声から発話者を推定し、発言内容と発話者の自動的な紐づけが可能。会議や対面営業、面談、動画への字幕付与など、複数人での対話シーンに最適。