GDSC Sookmyung 활동/10 min Seminar

MLops와 Vertex AI 맛보기

민휘 2022. 6. 6. 13:31

주제 선택 동기

  • 솔루션 챌린지에 참여하면서 기존 서비스를 머신러닝 기반으로 전환하게 되었는데, 머신러닝 모델을 배포하기 위해 수없이 많은 시행착오를 하던 와중 알게 된 분야
  • 참고로 필자는 머신러닝에 대해서 그렇게 잘 알지는 않음. 서버 개발 지향.

PART1. MLops 소개

MLops란?

🤔 : Devops는 들어봤는데…

개발과 운영을 따로 나누지 않고 개발의 생산성과 운영의 안정성을 최적화하기 위한 방법론이 DevOps이며, 이를 ML 시스템에 적용한 것이 MLOps입니다.

🤔 : MLOps는 뭐야?

MLOps는 머신 러닝 모델을 프로덕션으로 전환하는 프로세스를 간소화하고, 뒤이어 이를 유지관리하고 모니터링하는 데 주안점을 둔 머신러닝 엔지니어링의 핵심 운영론입니다.

🤔 : 알면 좋을 사람들

주로 데이터 사이언티스트, 머신러닝 엔지니어, DevOps 엔지니어 등이 참여

머신러닝을 엔터프라이즈 레벨에서 서비스에 구현하고자 한다면, MLOps는 선택이 아니라 반드시 구현!

 

MLops가 관리하는 영역

MLOps란 단순히 ML 모델뿐만 아니라, 데이터를 수집하고 분석하는 단계, ML 모델을 학습하고 평가하여 배포하는 단계까지 MLOps의 대상으로 보고 있다.

 

MLOps의 플로우

MLOps는 머신러닝 싸이클의 실험, 반복과 지속적 개선을 모두 다룹니다. 머신러닝 모델 개발과 개발 완료 후의 배포와 모델 모니터링, 설명 가능성, 학습까지 제공을 해야합니다.

 

왜 MLops를 써야하는가?

머신러닝의 대량 생산은 쉽지 않은 일입니다. 머신러닝 싸이클은 복잡한 구성 요소가 많이 모인 형태로 구성되어 있습니다. 또한 데이터 엔지니어링부터 데이터 사이언스, ML 엔지니어링에 이르기까지 여러 팀에 걸친 협업과 전달이 필요한 일이기도 합니다. 따라서 이 모든 프로세스를 동기화하고 협력이 이루어지는 상태를 유지하려면 엄격한 운영 원칙을 적용해야 합니다. 이 운영 방식의 지침이 되는 것이 MLops 입니다.

 

MLops platform : google cloud vertex ai

그렇다면 어떻게 MLops를 도입할 수 있을까요? 이렇게 복잡하고 많은 고려 사항들이 필요한 운영 방법론을 직접 만들면 시간이 너무 오래 걸리겠죠. 그래서 우리는 MLops platform을 사용할 수 있습니다. MLOps 플랫폼은 데이터 사이언티스트와 소프트웨어 엔지니어에게 협업 환경을 제공하여 반복 데이터 탐색, 실시간 공동 작업, 피처 엔지니어링, 모델 관리 등을 간편하게 수행할 수 있게 해줍니다. 이뿐만 아니라 관리형 모델 전환, 배포와 모니터링까지 가능합니다. 이번에 소개드릴 Google Cloud Vertex AI도 MLops platform입니다.

구글은 이 제품을 발표할 때, 모델 개발과 유지를 위한 코드를 80% 감소시킬 플랫폼이라고 소개했는데요. 과연 어떤 방법으로 코드를 감소시켰는지, Vertex AI를 사용해 모델을 개발하고 배포하는 과정을 살펴보겠습니다.

 

PART2. Vertex AI 맛보기

 

  1. Vertex AI 메뉴의 메인 화면

왼쪽 메뉴 목록에는 데이터 처리부터 예측, 배포까지의 모든 스텝을 순서대로 살펴볼 수 있습니다.

 

2. 처리할 데이터 선택하기

생성할 모델에 맞는 데이터 종류를 감안하여 데이터 셋을 생성합니다. 만약 타입이 내가 사용할 모델과 맞아떨어지지 않는다면, Vertex AI 외부에서 모델을 생성하고 도커 이미지를 생성하여 배포할 수도 있습니다.

 

3. 노트북 인스턴스 생성

사용할 GPU를 이 단계에서 선택합니다.

 

4. 모델 개발

이제 원하는 툴을 사용하여 모델을 개발합니다.

 

5. 학습하기

이제 데이터셋과 머신러닝 모델을 선택하여 모델을 학습시킵니다.

 

6. 엔드포인트에 배포하기

학습된 모델을 엔드포인트를 만들어 이곳에 배포할 수 있습니다.

 

7. 테스트

배포가 완료되면 테스트를 보내고 응답받을 수 있습니다. 머신러닝 모델을 자신의 서비스에 사용할거라면 위의 요청 양식을 참고해서 엔드포인트에 요청을 보내면 되겠죠.

 

 

'GDSC Sookmyung 활동 > 10 min Seminar' 카테고리의 다른 글

[GPT] 무엇이든 가능한 챗GPT  (0) 2023.01.30
☁️ Cloud CLI  (0) 2022.06.14
클라우드 네이티브란?  (0) 2022.06.03
디지털 소유권 - NFT와 메타버스  (0) 2022.05.16
CORS란?  (0) 2022.05.12