research notes

MLOps Introduction 본문

머신러닝/MLOps

MLOps Introduction

forest62590 2022. 6. 12. 00:25
728x90

** 한국산업기술진흥원(KIAT), AI 개발의 혁신견인차, 'MLOps'란 참고하여 작성 **

[KIAT 애자일 2021년 제7호] AI 개발의 혁신견인차, ‘MLOps’란.pdf
0.61MB

1. MLOps란

- MLOps라는 용어가 처음 등장한 곳은 2015년 공개된 ‘ML 시스템에 숨겨진 기술 부채(Hidden Technical Debt in Machine Learning Systems)’ 논문

- 데이터 관리 및 ML 시스템 개발과 서비스 운영(Operations)을 통합해 안정적으로 상품·서비스를 출시할 수 있도록 신속·유연한 개발을 추구하는 협업 방식

- 개발, 통합, 테스트, 출시, 배포, 인프라 관리 등 ML 시스템 구성의 모든 단계에서 모델 재학습 자동화 및 모델 모니터링을 지원하며 ML 모델 라이프사이클을 관리

2. MLOps의 부상과 기업현실

AI 시장 확대로 사진, 동영상, 텍스트 등의 비정형 데이터 양이 증가하며, 데이터 구축을 넘어 데이터 관리 및 활용 차원에서 MLOps의 중요성이 증대

  • 전 세계 AI 시장규모가 ‘25년까지 연평균 38.4% 성장해 1,840억 달러(약 203조 6,700억 원) 규모의 시장 형성 전망(BCC Research, '20)
  • MLOps의 시장 규모는 ’25년 약 40억 달러로 전망(구글 개발자 컨퍼런스 I/O, 가트너, ’21)

3. MLOps의 중요성

- ML 프로젝트는 생산 단계에서 발견된 심각한 문제로 전체 프로젝트르 재설계하거나 학습 모델을 폐기하는 경우가 다수이고 이외에 부서 간 이해 갈등 등 다양한 장애 요인이 존재

- ML 프로젝트의 작업 흐름을 매끄럽게 도와줄 수 있는 도구와 소통의 협업 방식으로 생산성을 개선시킬 수 있는 MLOps의 중요성이 증가

  • 다양한 데이터를 통해 최고의 성능을 가진 모델을 도출하고자 하는 ML 모델 개발자와 안정적인 운영이 필요한 서비스 관리자 사이에 간극 발생
  • 데이터, 개발, 운영이 분리될 경우 데이터 사일로가(silo) 발생하면서 급변하는 시장 상황에 대응이 느려지고 AI 성능 저하문제가 발생하며, 나아가 서비스 운영에도 비효율 초래

- ML 프로젝트의 숨겨진 기술 부채(Hidden technical debt)를 통제할 수 있는 기존과 다른 형태의 운용 시스템이 요구되며 MLOps 필요성 증대

  • ML 프로젝트를 단순 모델설계로 간주할 경우, 모델의 비즈니스로 활용 과정 등 이를 제외한 나머지가 숨겨진 기술 부채*로 작용하여 프로젝트 실패의 가능성이 증가
    * 학습과 생산 데이터가 일치하지 않을 때의 예측 불 가능성 등

- AI 연구 역사에 비해 최근에서야 MLOps가 주목받게 된 이유는 상용화 단계에 이르렀을 때 필요한 기술이기 때문이다. 인공지능 기술은 그간 일상 속 서비스보다는 연구실에서 많이 다루어져 학계와 산업계에서 AI 기술을 다루는 방식에는 생각보다 다른 점이 많다. 

  • AI 연구에서는 기존 과학적 방법론을 사용하는 만큼 고정된 범위 내 데이터를 사용한다. 반면 AI 서비스를 제공하는 기업에서는 사용자 데이터가 계속해서 쌓이는 만큼 이를 반영할 수 있도록 AI 모델을 수시로 점검·개선해야 한다.
  • AI 학계에서는 더 좋은 성능을 내거나 새로운 구조로 작동하는 모델을 개발하는 것이 관건이다. 반면 서비스를 제공하는 입장에서는 모델 성능 뿐만아니라 안정적인 운영과 시스템 구조로 AI 서비스를 지속 제공하는 것이 핵심이다.

즉, MLOps의 목표는 한마디로 ML 모델링 자체에 보다 집중할 수 있도록 안정된 인프라와 자동 운영 시스템을 마련하는 것이다. ML 모델 개발과 ML 모델 운영에서 반복 발생하는 문제를 최소화해 비즈니스 가치를 창출하는 일이라 할 수 있다.

4. MLOps 플랫폼 기업동향

- MLOps 생태계는 데이터 플랫폼을 중심으로 모델 배포/관리, 분석, 학습, 라벨링 등의 영역 에서 특화된 서비스들이 생겨나며 성장하고 서로 통합되며 발전을 거듭할 것으로 예상
- MS, AWS, 구글 등 글로벌 주요 IT기업들은 복잡한 절차가 필요한 AI·ML 기술개발의 효율성과 생산성을 향상하고자 MLOps 서비스를 개발하여 지원

< MLOps 대표 플랫폼 기업 >

- AI 개발의 효율성 극대화 및 MLOps 저변 확대를 위한 글로벌 AI 기업 연합 ‘AI 인프라스트럭처 얼라이언스(AI Infrastructure Alliance)’ 출범(‘19)

< AIIA AI Infrastructure Landscape Map >

5. 시사점

- MLOps는 안정된 인프라와 자동 운영 시스템을 제공하여 ML 모델 개발과 운영에서 반복 발생하는 문제를 최소화함으로써 기업의 비즈니스 가치 창출에 기여

- 데이터 구축이 끝이 아니라 데이터를 잘 관리하고 활용하는 것이 중요한 만큼 신속하고 유연한 AI 개발을 뒷받침하는 MLOps 관점에서의 대응이 보다 중요

References:

[1] 한국산업기술진흥원(KIAT), AI 개발의 혁신견인차, 'MLOps'란

[2] https://ai-infrastructure.org/ai-infrastructure-landscape/

[3] http://www.aitimes.com/news/articleView.html?idxno=139432

728x90

'머신러닝 > MLOps' 카테고리의 다른 글

MLOps Infrastructure Stack  (0) 2022.06.12
MLOps Principles  (0) 2022.06.06
데브옵스(DevOps)  (0) 2022.06.04
Comments