아동 영어 음성 녹음 안내
서울--(뉴스와이어)--인공지능(AI) 전문 기업 미디어젠은 한국지능정보사회진흥원(NIA)이 추진하는 ‘2021 인공지능 학습용 데이터 구축 사업’ 가운데 하나인 아동 음성 데이터 구축을 위해 9월 초부터 메트릭스 리서치와 함께 아동들의 음성 녹음을 본격적으로 시작했다고 29일 밝혔다.
한국어 5000시간, 영어 5000시간의 대규모 아동 음성 데이터를 구축해 성인보다 아이들의 말을 AI 서비스가 잘 인식 못하는 문제를 개선하고, 나아가 아동 대상 교육용 AI 튜터 등 학습 AI 서비스 확산을 기대하고 있다.
아동들은 교재를 활용해 제작된 문장을 책 읽듯이 낭독해 집에서 휴대전화, 태블릿 그리고 노트북으로 간편하고 쉽게 목소리를 녹음할 수 있다. 아동 보호자가 메트웍스 홈페이지에 가입해 미션을 신청해 진행할 수 있으며, 미션별 차등 사례비가 제공된다.
대상 아동은 만 4세 이상 미취학 아동부터 초등학교 6학년까지이며 △언어 종류(한글·영어) △거주지 △연령대 △녹음 환경에 따라 선택 참여할 수 있다. 한글과 영어에 아직 익숙하지 못한 아동들이 참여할 수 있도록 듣기 기능을 제공해 듣고 따라 읽으며 녹음을 할 수 있다.
아동 음성 수집을 담당하는 메트릭스 리서치 박두진 이사는 “AI 학습용 데이터로 아이들의 자연스러운 낭독 목소리를 수집하고 있으며, 성인 또는 아나운서 같은 정확한 발음의 녹음을 요구하지는 않는다”며 “영어를 외국인처럼 유창하게 녹음해야 한다는 생각에 어렵게 느끼는 경우가 종종 있는데, 데이터 수집 목표는 한국 아동의 영어 녹음인 만큼 영어를 잘하는 것은 중요하지 않고 한국 아동의 영어 음성이 중요하다”고 강조했다.
미디어젠 윤성준 부사장은 “아동의 음성 데이터는 성인보다 부족하며 특히 미취학 아동의 음성, 영어 음성은 특히 더 부족한 게 현실”이라며 “아동에게 부담을 주지 않도록 1000문장을 2주 이상 녹음할 수 있도록 구성했으며, 차근차근 녹음하면 큰 어려움이 없는 수준이므로 많은 아동의 참여로 높은 품질의 AI 학습용 데이터가 구축될 것으로 기대한다”고 말했다.
미디어젠은 방대한 AI 데이터를 수집·활용해 음성 AI 엔진 성능과 보유한 언어 학습용 AI 어학 튜터 솔루션을 고도화할 계획이다.
△아동 음성 녹음 신청: 메트웍스 홈페이지
△사례비: 8만5000원~12만원 현금 지급(상황별 차등)
미디어젠 개요
미디어젠은 음성 솔루션의 시작과 끝을 책임지는 기업으로 음성인식 시스템 및 AI 음성 신기술 개발 등 한발 앞선 기술을 제공한다.