올해 열린 NIA ‘초거대AI 데이터 구축 착수보고회’ 모습
서울--(뉴스와이어)--ChatGPT의 등장으로 올해 초부터 생성형 인공지능(AI)에 대한 관심이 뜨겁다. 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)에서 추진하고 있는 ‘AI 학습용 데이터 구축 사업’도 이러한 변화에 따라 초거대 AI를 위한 고품질·대규모 데이터 구축을 중심으로 사업이 추진되고 있다.
정보통신기술(ICT) 서비스 및 플랫폼 개발 전문 기업인 비디(대표 김기용, 독고세준, 이상명)는 올해 ‘초거대 AI’ 영역 자유공모를 통해 ‘초거대 AI 사전학습용 헬스케어 질의응답 데이터’ 구축 과제를 제안했고, 기술과 수행 역량의 우수성을 인정받아 데이터 구축 사업자로 선정돼 관련사업을 진행하고 있다고 밝혔다.
비디는 2020년 부터 ‘AI 학습용 데이터 구축 사업’에 참여해 올해로 4년째를 맞고 있으며, ‘데이터 수집·정제·가공 처리 도구’와 ‘데이터 수집 공정관리 플랫폼’에 대해 축적된 기술을 기반으로 사업에 기여하고 있다.
특히 이번 과제에서는 데이터 구축에 필요한 ‘데이터 수집·정제·가공 처리 도구’에 ‘초거대 AI’ 구축을 위한 단계별 데이터 처리 효율화 기술, 대량 데이터 분산 처리 기술 등을 적용했다.
또한 ‘데이터 수집 공정관리 플랫폼’은 오디오/프리텍스트/센싱데이터 등과 같이 다양한 유형의 데이터들을 수집, 정제, 흐름 제어하는 과정에서 실시간 모니터링은 물론 작업자별 공정 수치를 시각화함으로써 데이터 품질을 보증할 수 있도록 했다.
김용목 비디 전무는 “생성형 AI에 대한 기대가 큰 상황에서 해당 과제를 수행할 수 있어서 기쁘게 생각한다”며 “자체 기술로 확보된 ‘구문 정확성 검증 도구’와 ‘대화 데이터 정제 가공’ 솔루션을 적극적으로 활용해 데이터 품질을 확보함으로써 AI 모델 성능 향상에 기여할 것”이라고 밝혔다.
비디 소개
비디는 인공지능(AI), 메타버스, 블록체인, 클라우드, API를 포함한 정보통신기술(ICT) 융합형 서비스 개발과 플랫폼 운영 분야 전문 기업이다. 2003년 10월 블루다임이라는 사명으로 설립된 뒤 통신 분야 IT 기술에 대한 전문성과 사업에 대한 이해를 바탕으로 통신·전자 특화 솔루션을 제공해 시장과 고객을 창출하는 회사로 성장해왔다. 현재는 통신·전자 분야를 넘어 ICT 융합형 서비스 개발 및 오픈 플랫폼 구축 경험으로 인공지능과 메타버스, 블록체인, 클라우드, API 사업 분야로 영역을 넓히고 있다.