타임스탬프에 따라 영상 번역 자막 제작·편집이 가능한 ‘서브에디터’
서울--(뉴스와이어)--인공지능(AI) 음성 인식 및 AI 번역 전문 기업 엘솔루(구 시스트란 인터내셔널)가 올 하반기 출시 예정인 인공지능 동영상 자동 자막 번역 및 편집 서비스 ‘서브에디터(SubEditor, 가칭)’의 기술 개발을 완료했다고 20일 밝혔다.
서브에디터는 구어체 중심의 방송 콘텐츠에 전문화한 자동 자막 번역 생성기다. 엘솔루는 국내 OTT 방송 콘텐츠 글로벌화와 K-콘텐츠 산업 발전 및 육성을 도모하기 위해 개발했다. 영상 속 음성을 AI가 자동으로 인식하고, 스스로 번역해 편집된 자막을 영상과 함께 제공한다.
엘솔루는 유튜브 등 국내외 다양한 ‘OTT (Over The Top)’를 비롯해 대규모 사용자를 대상으로 제공하는 온라인 공개 수업 ‘MOOC (Massive Open Online Course)’ 등 영상 중심의 문화·교육·개인 콘텐츠 등에 서브에디터가 적극적으로 활용될 것으로 기대하고 있다.
엘솔루 담당자는 “AI가 동영상 속 음성을 인식하고, 이를 자막으로 생성하는 것은 매우 복잡하고 높은 수준의 기술력이 요구된다”며 “영상 장르에 대한 깊은 이해도는 물론, 다양한 사람들이 가진 발음·억양·강약에 대한 인식과 화자 분리, 배경 음악 및 소음 등을 모두 구분해 분리 및 제거할 수 있어야 한다”고 말했다.
이어 “또 음성 인식 뒤 생성된 텍스트와 번역된 자막은 영상 속 타임코드와 정확하게 동기화한 뒤 표시돼야 한다”며 “이뿐만 아니라 OTT, MOOC 등 서비스 제공 플랫폼 가이드라인을 준수할 수 있도록 자막 길이, 위치, 포맷 등을 조정할 수 있어야 하며 번역 자막도 이용자를 중심으로 장르 및 문맥에 맞게 정확히 이해해 생성돼야 한다”고 덧붙였다.
영상 내 발화자에게서 장르별로 정확히 음성을 인식해야 정확한 번역이 나올 수 있듯이 영상 자막 번역 서비스는 무엇보다 수준 높은 음성 인식 기술과 자연어 처리(Natural Language Processing) 기술이 필요하다. 국내 최고 OTT 콘텐츠에 특화한 인공지능 음성 인식 기술 및 자동 번역 기술을 보유한 엘솔루는 올 하반기 서브에디터 오픈베타 서비스 론칭을 시작으로 한국어, 영어, 스페인어 등 다국어 음식 인식 기술 확장을 통해 글로벌 영상 자막 서비스를 제공할 계획이다.
김우균 엘솔루 대표는 “정확한 음성 인식 기술은 인공지능 컨택센터(AICC) 외에도 영상 자막 번역 분야에서 핵심 기술로 인정받고 있다”며 “엘솔루의 서브에디터는 정확한 음성 인식과 번역 품질을 제공하는 만큼 K-콘텐츠 산업 육성뿐만 아니라, 전 세계 영상 공급·제작자들에게 새로운 빛줄기가 될 것으로 기대한다”고 말했다.
엘솔루 개요
엘솔루(구 시스트란인터내셔널)는 빅데이터와 인공지능(AI) 기술을 융합해 최적의 환경에서 고객 생산성을 높이는 음성 인식, 기계 번역 및 자연어 처리 등 AI 솔루션을 연구 개발하고, 솔루션을 공급하는 AI 기술 기업이다. 2005년 설립 이후 ‘인류 모두의 언어생활을 이롭게 하는 솔루션·기술·서비스로 인공지능 시대 선도 기업으로 성장’의 비전을 실천하고자 원천 기술을 바탕으로 다양한 제품·서비스를 제공하고 있다. 본사는 서울시 서초구 마방로에 있다. 주요 서비스로는 △AI 컨택센터(AICC) 등에 활용되는 국내 최고의 한국어 및 영어 음성 인식 솔루션 및 기술 △리우 및 평창 동계올림픽 등에 사용된 실시간 통·번역 서비스 △인공 신경망 기계 번역 기술을 활용한 카카오톡 내 인공지능 자동 번역 서비스 △자연어 처리를 응용·개발해 헬로톡에 공급한 인공지능 기반 영문법 교정 서비스 등이 있으며 오픈 API 플랫폼을 저렴한 비용에 공급하고 있다.