음성 데이터 수집·관리 시스템 화면
서울--(뉴스와이어)--정보통신기술(ICT) 서비스 및 플랫폼 개발 전문 기업 비디(대표 김기용·독고세준·이상명)가 최근 ‘인공지능 학습용 데이터 구축 사업’에 선정돼 음성 데이터의 효율적인 수집·가공 및 관리를 위한 시스템을 오픈했다고 밝혔다.
과학기술정보통신부, 한국지능정보사회진흥원(NIA)이 주관하는 인공지능 학습용 데이터 구축 사업은 디지털 뉴딜 ‘데이터 댐’의 핵심 사업으로, 산업 전반에 걸친 지능화 혁신과 일자리 창출에 목적을 둔다.
비디는 인공지능 학습용 데이터 구축 사업에 2년째 선정돼 참여하고 있으며, 올해는 화자 인식용 음성 데이터와 아동 음성 데이터 구축 과제에서 음성 데이터 수집·관리 시스템을 적용해 설계에 따라 편향 없이 데이터가 수집되도록 활용하고 있다.
이번 사업은 크라우드 소싱 방식으로 데이터를 수집·검수해 개인차에 따라 다를 수 있는 데이터 품질을 일정 수준으로 유지하고, 많은 양의 데이터를 짧은 기간에 구축하며 발생할 수 있는 휴먼 에러를 최소화하기 위해 시스템을 통한 공정 관리의 필요성이 대두되면서 추진됐다.
비디의 기술력과 지난해 2개 과제를 수행하면서 도출한 개선 사항을 반영해 음성 데이터 수집·관리 시스템을 구축, 과거 수동으로 처리했던 업무 대부분을 자동화해 업무량을 큰 폭으로 줄이고, 구축 시간을 줄이는 데 크게 이바지할 것으로 기대된다.
비디의 음성 데이터 수집·관리 시스템은 크라우드 소싱 플랫폼 ‘메트웍스’와 연동해 참여자들에게 포인트 지급 등 보상 시스템을 제공한다. 아울러 대시보드를 통해 개인 진척 상황을 쉽게 확인하고, 미션 수행을 독려하기 위한 기능도 제공한다.
데이터 수집 시에는 대상과 녹음 환경이 설계에 따라 진행되는지 검증할 수 있는 녹음 적합도 테스트 기능이 제공되며, 수집된 데이터는 즉시 검수 담당자에게 배정돼 실시간 검수가 가능하도록 개발돼 필요 없는 대기 시간을 최소화했다.
비디 독고세준 대표는 “이번에 개발된 음성 데이터 수집·관리 시스템을 통해 높은 품질의 데이터 구축에 이바지할 수 있기를 바란다”며 “앞으로 음성뿐만 아니라 이미지, 영상 등 여러 분야의 데이터 구축에도 수집·관리 시스템을 활용할 수 있도록 확장해 나가겠다”고 말했다.
비디 개요
비디는 인공지능, 메타버스, 블록체인, 클라우드, API를 포함한 정보통신기술(ICT) 융합형 서비스 개발과 플랫폼 운영 분야 전문 기업이다. 2003년 10월 블루다임이라는 사명으로 설립된 뒤 통신 분야 IT 기술 전문성과 사업에 대한 이해를 바탕으로 통신·전자 특화 솔루션을 제공해 시장과 고객을 창출하는 회사로 성장해 왔다. 현재는 통신·전자 분야를 넘어 ICT 융합형 서비스 개발 및 오픈 플랫폼 구축 경험으로 인공지능과 메타버스, 블록체인, 클라우드, API 사업 분야로 영역을 넓히고 있다.