‘챗GPT’는 1750억개 이상의 ‘파라미터(매개변수)’를 가진 초거대 언어모델 ‘GPT’를 기반으로 제작됐다. 거대 언어모델은 인간의 뇌에서 정보를 학습 및 기억하는 신경망을 모사한 셀프 어텐션(Self-Attention) 모델을 기반으로 학습하고 추론한다. 파라미터와 데이터의 양이 많을수록 AI의 지능은 높아지며, 이는 챗GPT가 똑똑하고 자연스럽게 대화할 수 있는 이유다.
국내 AI기업 솔트룩스(304100)가 지난 9월 출시한 신제품 ‘랭기지 스튜디오’도 최근 IT업계에서 이목을 끌고 있다. 랭기지 스튜디오는 버트(BERT)와 일렉트라(ELECTRA) 등 자연어 이해 모델뿐만 아니라 초거대 언어 생성 모델이자 챗GPT 서비스 구현에도 활용된 ‘GPT’ 등 거대 모델을 누구나 만들고 활용할 수 있도록 개발된 제품이다.
이를 통해 소량의 학습 데이터만으로도 금융, 법률, 공공, 민간 등 각 도메인에 특화된 언어모델을 빠르게 생성할 수 있으며, 텍스트 분류, 문장 임베딩, 정보추출 및 질의응답과 대화응답 서비스 등 다양한 업무를 수행하는 최적의 언어모델을 구축할 수 있다.
또 데이터 관리부터 구축한 모델의 배포와 통합 관리 등의 기능을 두루 갖춰, 복잡한 코딩 없이도 솔트룩스 톡봇과 연동해 상담 챗봇이나 지능형 검색 등 AI서비스를 누구나 쉽게 만들고 활용할 수 있다. 랭기지 스튜디오는 약 2000만명 이상이 사용하는 △국민비서 서비스 ‘구삐’를 비롯해 △헌법재판소 지능형 통합검색 서비스 △NH농협은행 콜센터 상담 분석 △삼성전자 북미 지능형 상담 시스템 등에 활용되고 있다.
솔트룩스는 챗GPT 수준의 대화 및 지식기반 칫챗 서비스인 ‘루시아(LUXIA)’를 내년 초 상용화할 계획이다. 특히 지난 2년간 미국 자회사를 통해 개발된 구버(Goover) 서비스를 통해 진정한 글로벌 인지검색 사업을 시작할 방침이다.
회사 관계자는 “비용과 인력 등 이유로 일반 기업들이 초거대 AI를 활용하기 어려운 가운데, 랭기지 스튜디오와 톡봇이 이러한 기술 양극화를 해소할 수 있을 것으로 기대한다”라며 “세계 AI 기술의 성장에 맞춰 기술과 제품을 지속적으로 강화시켜 나갈 예정”이라고 말했다.