서울대 공대 컴퓨터공학부 강유 교수(왼쪽), 허혜문 박사과정생
서울--(뉴스와이어)--서울대학교 공과대학(학장 홍유석)은 컴퓨터공학부 강유 교수와 허혜문 박사과정생이 작성한 논문이 ‘제15회 전자신문 ICT 논문 공모 대제전’ 최우수상을 수상했다고 밝혔다.
해당 논문에서 다룬 전이 학습은 미리 학습된 모델을 활용해 새로운 도메인에서 인공지능 과업의 정확도를 높이는 기법을 의미한다. 전이 학습은 특히 새로운 도메인에서 데이터가 부족할 때 미리 방대한 데이터로 학습한 모델을 활용해 성능을 높일 수 있다는 점에서 요즘 많은 관심을 받고 있다.
이번 논문에서는 새로운 도메인에 가장 적합한 모델을 빠르게 선택해 전이 학습을 하는 ‘TMI’라는 기법을 제안했다. TMI는 미리 학습된 모델 중 최적의 모델 구조를 선택하거나, 가장 좋은 원본 데이터로 학습된 모델을 선택하는 등 다양한 전이 학습 환경에서 활용할 수 있다.
한편 이번 연구는 과학기술정보통신부의 SW 스타랩 과제의 지원을 받았으며, 초거대 모델을 빠르고 가볍지만 정확도를 유지하는 모델로 압축하는 모델 경량화를 위한 최적의 모델을 선택하는데 활용될 예정이다.