본문 바로가기

리뷰

[리뷰]머신러닝 디자인 패턴

 

 

[도서 소개]

데이터 준비, 모델 구축, MLOps의 일반적인 문제에 대한 솔루션 구현하기

 

디자인 패턴이란 전문가 수백 명의 경험을 간단하고 접근하기 쉽게 체계화한 것이다. 이 책에는 데이터의 표현, 운영, 반복성, 재현성, 유연성, 설명 가능성, 공정성에 대한 30가지 디자인 패턴이 담겨 있다. 각 패턴에는 문제에 대한 설명, 다양한 잠재적 솔루션, 상황에 적합한 기술 노하우가 포함되어 있다. 머신러닝 프로세스 전반에 걸쳐 마주하는 일반적인 문제를 해결하고 싶은 실무자라면, 저명한 3명의 구글 엔지니어가 이 책에서 분류한 ‘이미 입증된 방법’을 배우고 실천해보자.

 

[목차]

CHAPTER 1 머신러닝 디자인 패턴의 필요성

CHAPTER 2 데이터 표현 디자인 패턴

CHAPTER 3 문제 표현 디자인 패턴

CHAPTER 4 모델 학습 디자인 패턴

CHAPTER 5 탄력성 디자인 패턴

CHAPTER 6 재현성 디자인 패턴

CHAPTER 7 책임 있는 AI

CHAPTER 8 연결 패턴

 

[주요 내용]

- ML 모델을 학습, 평가, 배포할 때 겪는 일반적인 문제와 해결법

- 임베딩, 특징 교차 등을 포함한 다양한 ML 모델 유형의 데이터 표현

- 특정 문제에 적합한 모델 유형을 선택하는 법

- 체크포인트, 배포 전략, 하이퍼파라미터 튜닝을 사용하는 강력한 학습 루프 구축

- 새로운 데이터를 반영하기 위한 재훈련, 업데이트할 수 있는 확장 가능한 ML 시스템 배포

- 이해관계자를 위한 모델 예측을 해석하고 공정성을 확인하는 법

- 모델의 정확도, 재현성, 탄력성을 향상하는 법

 

[서평]

시중의 머신러닝 입문 서적 대부분은 머신러닝이 무엇인지와 어떻게 작용하는 지에 대한 내용이 대부분이다. 그 다음 AI 연구랩에서 나온 새로운 방법의 수학적 측면을 설명하고 AI프레임워크를 사용하여 구현하는 방법을 배우는 방식이다. 

반면 이책은 경험이 풍부한 머신러닝 실무자가 머신러닝을 실제 문제에 적용할 때 사용하는 팁과 트릭의 근간이 되는 이유, 이를 깨달은 힘겨운 과정에 대한 경험을 배울수 있다.  이책은 머신러닝 과학자가 아니라 기업의 머신러닝 엔지니어를 위한 책이다. 

이책에서는 지금 활발히 진행중인 분야에 대해서는 다루고 있지않고 있다. 예를 들어 양방향 인코더, 어텐션 메커니즘, 단락 계층등에 대한 내용은 거의 찾을 수 없을 것이다. 

이 책은 기업의 머신러닝 엔지니어가 일상 업무에 사용할 만한 일반적인 패턴만을 포함하고자 했기 때문이다. 데이터 아키텍처를 예를 들면 데이터 아키텍처에 대한 대학 과정은 다양한 데이터 구조의 구현을 탐구해야 하고, 데이터 아키텍처 연구원은 수학적 속성을 공식적으로 표현하는 방법을 배워야 한다. 그러나 실무자에게 필요한 것은 더 실용적인 내용이다. 기업의 소프트웨어 개발자는 배열, 링크드 리스트, 맵, 세트, 트리를 효과적으로 사용하는 방법만 알면된다. 이책은 구글의 뛰어난 머신러닝 석학들이 모여서 집필한 “머신러닝 디자인 패턴”은 기업에서 발생하는 대부분의 시나리오에 대응할 수 있는 30가지 패턴들을 다루고 있습니다. 검증된 아키텍처와 비즈니스 사용 사례를 통해 바퀴를 재발명하는 데 들어가는 시간을 줄이고, 꼭 필요한 비즈니스에 집중 할수 있을겁니다.

다양한 기술 의사결정에 있어서 기준점이 될어 줄뿐만 아니라 데이터 분석팀을 어떻게 구성할지 부터 아키텍처 구성에 있어서 확신과 안도감을 줄수 있는 지침서 입니다.

 

 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."