본문 바로가기

Power Query

구조화된 데이터 형식

파워쿼리의 기초를 튼튼하게 하기 위해서 엑셀의 셀 개념을 잊어 버려야 한다. 파워쿼리에서는 셀이 존재하지 않기 때문이다. 간혹 강의를 하는 분들 중에 엑셀의 표를 이야기 하면서 데이터베이스라는 용어를 쓰는 경우가 종종 있는것을 확인 할 수 있는데 엑셀은 데이터베이스가 아니다. 데이터베이스에 접근 할 수는 있지만, 엑셀을 데이터베이스 처럼 쓴다는 표현은 엄연히 잘 못된 것이다. 어떤 의도를 표현 한것인지는 미루어 짐작 할 수 있지만, 적어도 지식을 전달하는 전달자가 정의된 용어를 혼동해서 쓰는것은 어떤 경우에도 바람직하다고 말 할 수 없을 것이다.

많은 데이터베이스 관련 서적에서 스프레드시트와 데이터베이스의 차이점에 대해서 비교를 한다. 엑셀은 스프레드시트이지 데이터베이스가 아니다.

파워쿼리는 데이터베이스의 가장 핵심이 되는 구성 요소인 테이블 형식의 데이터셋을 처리한다. 그렇기 때문에 파워쿼리로 가져와지는 원본 데이터 형식은 예외 사항 없이 데이터 표 형식을 띄게 되는 것이다.

이렇게 데이터베이스의 테이터셋 형식인 테이블 구조가 전재가 되어야만 리스트와 테이블이란 데이터 형식을 이야기 할 수 있는 것이고 이런 구조적 데이터셋을 기반으로 하기 때문에 첫행을 글머리로 올린다던가 병합등을 할 수 있게 되는것이다.

참고로 데이터베이스가 되기 위해서는 가장 핵심적인 3가지 기능이 지원되어야 한다. 데이터셋을 관리 할 수 있는 입력,삭제, 수정 기능이 있어야 하고 쿼리를 정의 할 수 있어야 하고, 마지막으로 여러 사용자들이 공유 할 수 있어야 한다.

파워쿼리는 엑셀 M 언어라는 스크립트 형식의 함수 기반언어이다. 주 목적은 데이터셋으로 부터 데이터를 추출하고, 변형하여 로드하는 것이다.우리가 흔히 이야기 하는 ETL 작업에 최적화된 언어를 사용하여 데이터를 우리가 원하는 형태로 바꿔가는 과정을 보다 사용자가 편리하게 사용 할 수 있는 인터페이스를 제공해 주고 있는 것이다.

물론 파워쿼리가 익숙하지 않은 사용자들에게 있어서는 편리하게 사용 할 수 있게 제공해 준다는 부분이 그렇게 와 닿지는 않을 수 있다. 하지만, 조금만 인내력을 가지고 익숙해 지다 보면 분명 이말에 동의 할 수 있게 될 것이다.

파워쿼리를 보다 자세히 알고 싶은 분들은 꼭 아래 강의를 본인의 것으로 만드시길 바란다.