ALSOK(本社:東京都港区、社長:青山 幸恭)は、人の話す声から「誰が話しているか」を認識して本人確認を行う、バイオメトリクス認証の1つである話者認識技術において利便性を高める、独自のアルゴリズムを開発しました。
ALSOK独自のアルゴリズムにより、子供からお年寄りまで「誰でも」「簡単に」利用でき、また、年齢とともに変化する声質にも対応できる話者認識技術が実現しました。
今後は、さらなる精度向上に努めると共に、実用化に向けた研究開発を進めてまいります。
記
1 従来の本人確認の手段
本人確認の手段として、暗証番号やIDカードなどが広く利用されています。これらは、暗証番号を忘れた、IDカードを持っていないといった場合に、サービスを利用できないという不便さがあります。
これに対しバイオメトリクス認証では、指紋や顔、静脈、虹彩などの身体的な特徴によって個人を特定するため、暗証番号を覚える、IDカードを持ち歩くといった必要はありません。利便性が高く高精度な本人確認の手段として期待されていますが、課題もあります。
・暗証番号 ・IDカード |
× 暗証番号やIDカードを忘れた場合に利用できない |
・バイオメトリクス(生体)認証 ※話者認識技術を除く |
○ 暗証番号を覚える、IDカードを持ち歩くといった必要がない × 心理的な抵抗が大きい(指で触る、顔が撮影されるなど) × 利用者や利用環境に対する制約が多い(手袋をしてはいけない、マスクをしてはいけない、逆光にならないようにカメラを設置するなど) × 個人の登録に手間や時間がかかる(大量の画像を収集するなど) |
・話者認識技術  ※バイオメトリクス認証の一つ |
○ マイクに向かってキーワードを発声するだけであるため、「簡単に」利用できる × 特定の年齢層で精度が低下することがあり、幅広い年齢層に対応することが困難 |
2 ALSOK話者認識技術の特長
ALSOKが新たに開発した話者認識技術(特許出願中)は、従来の話者認識技術の課題を改善し、以下のような特長があります。
(1)年齢層によらない安定した認識精度を実現
個人差に対応して、安定した認識精度を得る、ALSOK独自の技術を開発しました。これにより、子供からお年寄りまで、年齢によらず高い認識精度を実現しました。
(2)少ない登録音声データで認識を開始
従来技術では、大量の音声を用いて登録者を学習していたため、登録作業に多くの手間と時間を要していましたが、独自の技術により、少ない音声データで登録が完了します。
(3)年齢とともに変化する声質に対応
直近の「話した声」でデータベースを自動的に更新し、常に最新の声質に対応する独自技術を開発しました。そのため、年齢とともに変化する声質にも対応します。
3 話者認識技術の応用例
話者認識技術の研究開発を進めることで、様々なセキュリティシーンでの応用が可能となります。
※上記の応用例は本社ショールームで体験いただけます。
4 実用化
2年以内の実用化を目指し、研究開発を進めてまいります。
5 研究者
ALSOKセキュリティ科学研究所
6 参考 「話者認識」と「音声認識」の違い
(1)話者認識
声の音質(周波数情報)から、予め登録された「誰が話しているか」を認識する技術です。話者認識を行う従来の製品は、音声を登録する際に、本人の音声データを大量に用意する必要がありました。そのため、ALSOKでは、少ない音声データで登録が完了する、独自のアルゴリズムを開発しました。
(2)音声認識
人の声から「何を話しているか」を認識する技術です。最近では、スマートフォンや家電製品などに音声認識機能が搭載され、人の声で機器を操作できるようになり、話題となりました。
以 上