“못 알아들어 속터지는 AI 스피커 이제 끝”

“못 알아들어 속터지는 AI 스피커 이제 끝”

유용하 기자
유용하 기자
입력 2021-02-15 15:07
업데이트 2021-02-15 15:07
  • 글씨 크기 조절
  • 프린트
  • 공유하기
  • 댓글
    14

카이스트 이건재 교수팀, 사람 귀 흉내낸 고감도 음성인식센서 개발

못 알아들어 속 터지는 인공지능 스피커, 이제는 없다
못 알아들어 속 터지는 인공지능 스피커, 이제는 없다
국내 연구진이 음성인식 고감도 인공지능 기반 기술을 개발했다.

언스플래쉬 개발
최근 인공지능(AI) 스피커를 사용하는 사람들이 많아지고 있다. 음성인식 수준이 높아졌다고는 하지만 여전히 제대로 알아듣지 못하고 엉뚱한 답변을 내놓거나 다른 명령을 수행하는 경우가 있다. 여전히 ‘못 알아들어’ 속터지는 경우가 잦다. 이에 국내 연구진이 사람의 귀를 흉내내 초고감도 인공지능 기반 음성센서를 개발해 주목받고 있다.

카이스트 신소재공학과 연구팀은 음성 주파수 영역에서 센서의 막이 큰 진폭으로 진동하는 공진현상을 활용해 전기신호가 만들어지는 공진형 유연 압전 음성센서를 개발해 정확도가 높은 초고감도 인공지능 기반 화자 식별 및 음성 보안기술을 구현했다고 15일 밝혔다. 또 스마트폰과 인공지능 스피커에 탑재해 제품화하는데도 성공했다. 이번 연구결과는 기초과학 및 공학분야 국제학술지 ‘사이언스 어드밴시스’ 12일자에 실렸다.

인간이 먼 거리의 소리를 인식하는 방법은 달팽이관에 있는 사다리꼴 막이 가청주파수 대역에서 공진현상을 발생시켜 소리를 증폭시킨다. 연구팀은 사람의 귀를 흉내내기 위해 얇은 유연 압전막을 사용해 여러 공진 채널을 구현해 소리를 초고감도로 식별할 수 있는 공진형 음성 센서를 만들었다.
스마트폰 및 인공지능 스피커에 탑재된 유연 압전 음성 센서
스마트폰 및 인공지능 스피커에 탑재된 유연 압전 음성 센서 카이스트 제공
유연 압전 음성센서는 신호 대 잡음비(SNR)가 우수해 음성인식 기능이 뛰어나고 다수의 채널을 이용해 적은 데이터양으로도 화자 식별 정확도를 높일 뿐만 아니라 원거리에서 스마트 기기들을 정확하게 제어할 수 있다. 연구팀이 개발한 음성센서를 같은 조건에서 기존 기술과 비교한 결과 음성인식 오류율을 60~95%까지 줄이는 것으로 확인됐다.

이건재 신소재공학과 교수는 “이번에 개발된 기술은 높은 민감도를 갖고 있으며 크기를 획기적으로 줄였기 때문에 미래 인공지능기술을 작동시키는데 핵심 센서로 적용할 수 있다”라며 “현재 대량생산 공정이 완성 단계에 있기 때문에 곧 상용화될 수 있을 것”이라고 말했다.

유용하 기자 edmondy@seoul.co.kr

많이 본 뉴스
최저임금 차등 적용, 당신의 생각은?
내년도 최저임금 결정을 위한 심의가 5월 21일 시작된 가운데 경영계와 노동계의 공방이 이어지고 있습니다. 올해 최대 화두는 ‘업종별 최저임금 차등 적용’입니다. 경영계는 일부 업종 최저임금 차등 적용을 요구한 반면, 노동계는 차별을 조장하는 행위라며 반대하고 있습니다. 당신의 생각은?
찬성
반대
모르겠다
광고삭제
위로