본문 바로가기

리뷰

[리뷰]스파크를 이용한 자연어 처리



[목차]

[PART I 기초]

CHAPTER 1 시작하기

CHAPTER 2 자연어 처리 기초

CHAPTER 3 아파치 스파크의 NLP 라이브러리

CHAPTER 4 딥러닝 기초

 

[PART II 빌딩 블록]

CHAPTER 5 단어 처리

CHAPTER 6 정보 검색

CHAPTER 7 분류와 회귀

CHAPTER 8 케라스를 사용한 시퀀스 모델링

CHAPTER 9 정보 추출

CHAPTER 10 주제 모델링

CHAPTER 11 단어 임베딩

 

[PART III 애플리케이션]

CHAPTER 12 감성 분석과 감지

CHAPTER 13 지식 베이스 구축

CHAPTER 14 검색엔진

CHAPTER 15 챗봇

CHAPTER 16 객체 문자 인식

 

[PART IV NLP 시스템 구축]

CHAPTER 17 다국어 지원

CHAPTER 18 수동 레이블링

CHAPTER 19 NLP 애플리케이션 제작



[주요 내용]

- 자연어 처리와 Spark NLP, 딥러닝 기초를 설명합니다.

- 토큰화, 문장 분할, 개체명 인식 방법을 살펴보고 각각의 작동 방식을 이해합니다.

- 자신만의 NLP 애플리케이션 구축에 필요한 설계, 개발, 실험 과정을 차례대로 살펴봅니다.

- NLP 애플리케이션 제작과 배포 시 고려해야 할 중요한 항목을 알아봅니다.

 

[서평]

요즘 자연어 처리애플리케이션 개발이 뜨고 있습니다. 하지만 막상 시작하고 싶지만 어디서 부터 해야하는지 어떤 도구를 사용 해야 하는지 막막합니다. ‘스파크를 이용한 자연어 처리’에서는 자연어 처리에 완벽한 Spark NLP에 알아 봅니다. 우선 100% 오픈소스로 다양한 모델과 파이프라인 사용이 가능 합니다. 그리고 아파치 스파크 기반으로 구축된 유일한 NLP 라이브러리로 다양한 확장성이 가능 합니다. 파이썬, 스칼라, 자바 언어등 다양한 언어를 지원합니다. Spark NLP를 구현하기 전에 먼저 3가지 관점을 살펴보겠습니다.

 

첫째 소프트웨어 개발자의 관점

  • 애플리 케이션이 수행해야 할 작업에 초점을 맞춥니다.

둘째 언어학자의 관점

  • 추출하려는 데이터의 내용에 초점을 맞춥니다.

셋째 데이터 과학자의 관점

  • 데이터에서 필요한 정보를 추출하려는 방법에 초점을 맞춥니다

 

이책의 구성은 크게 4파트로 되어 있습니다.

파트1에서는 자연어 처리 이해에 필요한 기본적인 언어학 개념과 딥러닝 기초 개념 소개합니다.

파트2에서는 NLP 애플리케이션 구축에 필요한 기술과 작동원리를 소개합니다.

파트3에서는 NLP 애플리케이션을 직접 구축해보며 과정을 배웁니다.

파트4에서는 NLP 애플리케이션 시스템을 구축할 때 고려해야 할 사항에 대해서 자세히 배웁니다.

 

친절하고 다양한 예시



실용적인 예제 실습

영화 리뷰 작성자의 감정 분석하기

지식 베이스 구축하기

검색엔진 개선하기

챗봇 애플리케이션 만들기

이미지 텍스트 추출하기

 

응용력 강화를 위한 요소 제공





아파치 스파크 NLP 라이브러리는 인공지능 프레임워크 및 도구 중에서 7번째(오라일리 설문조사)로 인기 있는 라이브러리로 선정될 정도로 널리 사용되어 있습니다. 오픈 소스 자연어 처리 라이브러리로 사용으로 크게 부족함이 없다고 생각합니다. 이책에서 자연어 처리를 하는 AI 애플리케이션 구축 및 Spark NLP 기본 사항과 구성요소 등 쉽게 이해할수 있도록 구성되어 있어 자연어 처리 분야를 공부 하고 싶은 분들에게 적극 추천 합니다.



 "한빛미디어 <나는 리뷰어다> 활동을 위해서 책을 제공받아 작성된 서평입니다."