PM업무 회고 🍎

PM이 알아야 할 최소한의 데이터 정리 (SQL)

Lamp(램프) 2023. 3. 18. 18:18
기획자에게 중요한 데이터 분석 능력, 기획자에게 필요한 데이터 능력이라는 것은 무엇일까요? 필자는 데이터 능력이 중요하다는 정보를 듣고 SQLD 자격증 공부를 시작했지만, 무언가 어색한 것을 발견합니다. 자격증을 취득하면 물론 도움이 되겠지만, 실무에서 실질적인 도움이 될까와 실무에서 사용하는 구문은 정해져있고, 기획자에게 필요한 역량은 문제해결을 위한 데이터 분석 역량이였습니다. 

 

그래서 정말 기획자로서 필요한 데이터 분석 역량을 기르기 위해서는 어떻게 해야 할지 알아보고자 합니다. 데이터 분석 능력이란, 숫자와 사실에 근거해서 의사결정하는 능력이라고 합니다. 문제 상황에서 숫자와 데이터에 근거해서 가설을 검증하여 해결해 본 경험이 있는 것을 데이터 분석 능력이 있다고 할 수 있습니다. 단순히 엑셀을 알고, SQL 문법을 외움으로 데이터 분석 역량을 기르기란 다소 어려움이 있습니다. 

 

 

현업의 실제 데이터를 다루는 것이 가장 좋지만, 사전에 5개의 단계로 익혀볼 수 있습니다. 그 만큼 문제를 찾고 문제를 해결하기 위해 어떤 데이터를 보는 것을 아는지가 데이터 분석의 첫 단계라고 할 수 있습니다.  

 

 

1. 문제가 무엇이며, 무엇을 파악하고자 하는지? 

2. 1번이 정해짐에 따라 어떤 데이터를 수집해야하는지 확인할 수 있습니다. 

3. 회사에서 수집되는 정보 데이터 일수도 있고, 추가적으로 시장 상황을 고려하기 위한 공공 데이터도 찾아볼 수 있습니다. 

4. 공공 데이터는 무료로 확인할 수 있는 곳들이 있어요. 금융기관이나 공공기관 중 오픈 데이터들을 찾아볼 수 있습니다. 

5. 이러한 과정을 계속 거치다 보면 데이터 감각(무슨 데이터로 말을 해야)을 기를 수 있습니다.

 

 


 

1. 기본지식

엘셀과 database를 비교해 보자면 아래와 같이 이해하면 편합니다. 그리고, 각 엑셀파일이 연결되어 있는 것이 관계형 데이터베이스(RDBMS)라고 할 수 있는데, 공통된 key를 갖고 있어야 관계형 데이터 베이스가 성립됩니다.  

 

 

- 엑셀파일 = Database = 데이터가 쌓여있는 방

- 시트 = Table = 데이터를 특성에 따라 쌓아 놓은 탁자

- 열(세로줄) = Column(Field) = 데이터의 속성

- 행(가로줄) = Row(Value) = 데이터

 

회사에 어떤 관계형 데이터가 존재하고, 각 데이터들을 어떤 key를 기준으로 묶여있는지 파악해야 하며 관계된 데이터들을 조회하고 분석하는 프로그래밍 언어를 SQL(Structhred Query Language)라고 합니다. 쉽게 말해 구조화된 데이터를 보기 위한 언어라고 보시면 됩니다.

 

 

더 자세하게는 구조적 쿼리 언어(SQL)는 관계형 데이터베이스에 정보를 저장하고 처리하기 위한 프로그래밍 언어입니다. 관계형 데이터베이스는 정보를 표 형식으로 저장하며, 행과 열은 다양한 데이터 속성과 데이터 값 간의 다양한 관계를 나타냅니다. SQL 문을 사용하여 데이터베이스에서 정보를 저장, 업데이트, 제거, 검색 및 검색할 수 있습니다. 데이터베이스 성능을 유지 관리하고 최적화하는 데 SQL을 사용할 수도 있습니다. 

 

 


2. SQL 구문

여기서 현업에서 자주 쓰이고, 필요한 SQL 구문은 아래와 같습니다. 해당 구문의 특징을 알고, 전체 데이터에서 필요한 데이터를 뽑을 수 있을 정도면 충분합니다. 이 구문을 활용해서 DB에서 원하는 데이터를 추출할 수 있는지, 어떤 데이터가 필요하고 어떻게 요청할 수 있을 정도로 알아야 합니다. 

 

- SELECT: 어떤 컬럼(필드)들을 선택할 것인가

- FROM: 어떤 테이블(시트)을 불러올 것인가

- WHERE: 필터링 기준은 무엇인가

- Group By: 집계 기준은 무엇인가(월별, 매장별, 고객별 데이터 등)

- Order By: 어떤 기준으로 정렬할 것인가

- JOIN: 어떤 테이블끼리 연결할 것인가 (가로 연결)

- UNION: 어떤 테이블끼리 연결할 것인가(세로 연결)

 

 


3. ERD 

ERD는 Entity Relationship Diagram는 시스템의 엔티티들이 무엇이 있는지 어떤 관계가 있는지를 나타내는 다이어그램입니다. ERD를 해독하며, 서비스의 DB 구조를 이해하는 능력을 키울 수 있습니다. 데이터가 어떻게 흐르고 어떻게 보관되고 어떤 영향을 주는지 이해해야 합니다. 그리고 식별, 비식별관계, 기본키, 외래키의 개념도 알면 도움이 됩니다. 

 

ERD

 


 

4. 책, 강의

마지막으로, 더 공부하기 좋은 실습 사이트, 책을 남기고 글을 마치겠습니다. 앞으로 데이터 분석 역량을 키우기 위해 더욱 공부하고 적용해 볼 수 있는 PM이 되기 위해 달려보겠습니다. 현업에서 문제를 찾고 문제를 해결하기 위해 어떤 데이터를 보는 것을 알며, 원하는 데이터를 뽑아내기 위해 큰 그림을 볼 수 있는 PM이 되어보고자 합니다. 

 

- 실습 사이트 : http://sqlfiddle.com/#!9/9eecb

- 책 : 모두의 SQL 

 

모두의 SQL : 네이버 도서

네이버 도서 상세정보를 제공합니다.

search.shopping.naver.com

- 강의 추천 : https://www.youtube.com/watch?v=c8WNbcxkRhY

 

 

 

 

출처

[1] 아마존 

[2] https://brunch.co.kr/@95sujin/49

[3] https://www.researchgate.net/figure/Entity-Relationship-Diagram-ERD-of-the-database_fig1_305222386