セキュリティ科学研究所 音情報グループで取り組んでいる、話者認識技術に関する研究について、
その研究成果を発表いたしました。
主 催 :社団法人日本音響学会(2012年秋季研究発表会)
開催日 :2012年9月19日(水)〜21日(金)
場 所 :信州大学長野(工学)キャンパス(長野県長野市)
タイトル:最小距離探索によるテキスト独立型話者認識
発表者 :ALSOKセキュリティ科学研究所 田中康貴
概 要 :音声から個人を特定する話者認識技術について、認識に用いるキーワードを限定せず、短時間の発声でも
高精度に認識可能な手法を提案しました。
発話内容に依存せず、発話者を認識するテキスト独立型の話者認識の検討を行っています。
一般的にテキスト独立型の話者認識ではVQやGMMを用いた方法が提案されていますが、本稿は登録音声と入力音声との
周波数特徴量の距離を指標とした最小距離探索によるテキスト独立型話者認識手法を提案しました。
成人、児童、高齢者600人のデータを用いて話者認識実験を行った結果、登録音声が10秒以上、入力音声が
2秒以上のとき話者識別率、話者照合率ともに98%以上という高い認識率が得られました。
本技術は特定の話者の音声のみを受け付ける音声認識装置や、手ぶらで声を用いた入退室管理などへの応用が
期待されます。
ALSOKの研究成果トピックス一覧へ戻る