Services|인공지능 솔루션 연구개발

(주)딥로딩, 베트남·카자흐스탄 등 비영어권 4개국 소버린 LLM 개발 완료… "글로벌 빅테크가 외면한 시장을 선점하다"

과기정통부·NIA 주관 연구 과제 수행으로 4개국 정부 납품·시연 완료

AI 전문기업 (주)딥로딩이 과학기술정보통신부와 NIA(한국지능정보사회진흥원)의 연구 과제를 수행하며 베트남·카자흐스탄·캄보디아·탄자니아 4개국을 위한 소버린 LLM 모델을 성공적으로 개발하고, 각국 정부 및 공공기관을 대상으로 기술을 납품·시연했다고 밝혔다.

ChatGPT·Bard 등 글로벌 빅테크 언어 모델들은 비영어권 언어 데이터를 충분히 학습하지 않아, 해당 언어로 질문 시 부정확한 답변을 내놓거나 아예 응답하지 못하는 한계를 보인다. 반면 베트남·카자흐스탄·캄보디아·탄자니아 등 신흥 IT 시장은 급성장하고 있으며, 각국 정부는 자국 언어와 문화를 이해하는 '소버린 AI 모델'의 필요성을 강하게 인식하고 있다. 딥로딩은 이 공백을 정확히 포착했다.

카자흐스탄 정부 방문 및 시연 2024.09
카자흐스탄 정부 방문 및 시연 2024.09
카자흐스탄 연수생 한국 초청 교육 2024.11
카자흐스탄 연수생 한국 초청 교육 2024.11
카자흐스탄 연수생 교육 현장
카자흐스탄 연수생 교육 현장

딥로딩은 국가별 Instruction QA 데이터를 직접 구축하고 체계적인 Fine-tuning을 수행하여 4개국 언어 모델을 완성했다. 특히 기존 대형 언어 모델이 전혀 학습 데이터를 보유하지 않은 카자흐어·크메르어에 대해서는 Pretrain 단계를 추가 설계, 언어 기반 역량을 먼저 내재화한 후 도메인 특화 학습을 진행하는 2단계 전략을 적용했다.

캄보디아 정부 방문 및 AI 구축 협의 2025.06
캄보디아 정부 방문 및 AI 구축 협의 2025.06
캄보디아 정부 방문 및 AI 구축 협의 2025.06
캄보디아 정부 방문 및 AI 구축 협의 2025.06

이 접근법은 제한된 데이터 환경에서도 실용 수준의 언어 이해 능력을 확보하는 데 성공했다는 점에서 주목받고 있다. 딥로딩이 직접 구축·기여한 대용량 말뭉치 데이터는 AI-Hub(aihub.or.kr)를 통해 국가 단위로 공개·확산되고 있으며, 대한민국 AI 데이터 인프라의 기반으로 자리잡고 있다.

베트남 정부와 기술 협력, 현장 실증 서비스까지

베트남 정부 디지털전환국은 딥로딩의 베트남어 LLM 기술력을 직접 확인하고, NIA 글로벌협력팀을 통해 공식 시연 및 기술 발표를 요청했다. 딥로딩은 현지 정부 관계자 앞에서 베트남어 질의응답, 문서 요약, 도메인 특화 추론 등 실제 업무 시나리오를 기반으로 한 기술 시연을 성공적으로 수행했으며, 이를 계기로 양국 간 AI 기술 협력의 구체적인 접점을 마련했다.

베트남 정부는 딥로딩이 구축한 말뭉치 데이터와 언어 모델에 관심을 표명하며, 향후 협력 방향에 대한 논의를 지속하고 있다. 이번 정부 대상 시연과 기술 발표는 딥로딩의 소버린 LLM 기술이 연구 단계를 넘어 실제 공공 현장에서 통할 수 있음을 입증하는 중요한 이정표가 됐다.

한국 파견 베트남 근로자를 위한 AI 상담 서비스 시범 구현

2024년에는 한국-베트남 IT협력프로젝트 공동협력과제로, 한국 파견 베트남 근로자를 위한 AI 상담 시범 서비스를 구현했다. 고용허가제·비자 발급·직장 생활·한국 생활 전반의 정보를 베트남어로 즉시 제공하는 이 서비스는, 언어 장벽으로 인해 소외되기 쉬운 외국인 근로자가 필요한 정보를 모국어로 신속하게 얻을 수 있도록 설계됐다.

이 시범 서비스는 딥로딩의 베트남어 LLM이 연구소 밖 실제 현장에서도 작동한다는 것을 증명한 첫 번째 사례다. 현장 피드백을 바탕으로 모델을 지속 개선하며 서비스 품질을 끌어올렸으며, 질문 의도를 정확히 파악하고 베트남어 맥락에 맞는 자연스러운 답변을 생성하는 능력을 검증받았다. 향후 유학생 안내, 국제 결혼, 현지 취업 상담 등 다양한 공공·민간 서비스로의 확장이 가능하다.

베트남 정부 방문 및 기술 시연 2023.12
베트남 정부 방문 및 기술 시연 2023.12
베트남 서비스 현장
베트남 서비스 현장
AI 상담 서비스 시범 화면
AI 상담 서비스 시범 화면

"딥로딩은 "글로벌 AI 기술이 닿지 않는 언어적 빈공간에 딥로딩의 기술이 자리잡고 있다"며 "각국 정부와의 직접 협력을 통해 축적한 현장 노하우는 앞으로의 소버린 AI 사업 확장에 가장 강력한 자산이 될 것"이라고 밝혔다."

본 기사는 과기정통부·NIA 주관 연구 과제 '비영어권 국가 AI 언어 모델 개발' 및 '한국-베트남 IT협력프로젝트' 성과를 바탕으로 작성되었습니다.