'OLAP'에 해당되는 글 1건

  1. 2010.09.15 OLAP의 정의와 활용

OLAP의 정의와 활용

Data Architecture 2010. 9. 15. 10:08

올랩 OLAP 의 정의  [ Online Analytical Processing ]

이용자가 직접 데이터베이스를 검색, 분석해서 문제점이나 해결책을 찾는 분석형 애플리케이션 개념. 대규모 데이터를 이용한 질의 검색 시 발생한 대량의 결과값을 단순히 사용하기는 어렵다. 대부분 이 같은 질의는 복수의 데이터 정보 테이블을 기반으로 처리되고, 요약화된 정보를 얻기 위해 연산 처리가 수반되어 장시간이 소요되기 때문이다. 올랩 툴 또는 올랩 서버는 온라인 검색을 지원하는 데이터 웨어하우스(DW) 지원 도구인데, 이 같은 대규모 연산이 필요한 질의를 고속으로 지원한다.

- 다차원 정보분석
- 최종 사용자가 다차원 정보에 직접 접근하여 대화식으로 정보를 분석하고 의사결정을 활용하는 과정
- 1993년 E.F.Codd에 의해 처음 사용된 용어
- 온라인거래처리프로세싱(On-Line Transaction Processing; OLTP)에 상대되는 개념
- 데이터웨어하우스 환경에서 데이터 접근 전략의 중요한 요소로 자리잡아가고 있다. 

1. 다차원 정보
정보는 본질적으로 다차원이며, 다차원 모델은 비즈니스를 표현하는 가장 자연스러운 형태이다.

2. 직접 접근
데이터는 사용자가 원하는 형태로 존재하지 않음
OLAP환경에서 사용자는 필요한 시점에 정보 매개자 없이 정보원에  직접 접근하여 다양한 각도에서 분석을 수행 할 수 있다.

3. 대화식 분석
정형화된 보고서를 단순히 조회하는 방식에서 벗어나 대화식으로 정보를 분석하게 된다.

4. 의사결정에 활용
OLAP시스템의 목적은 사용자가 기업의 전반적인 상황을 이해 할 수 있게 하고 의사결정을 지원하는데 있다 

OLTP

OLAP

워크플로우 기반 (업무 프로세스 중심)

사용자의 분석 수행 기반 (주제 중심)

트랜잭션 처리 (입력, 조회, 삭제, 수정)
운영자 계층 시스템

보고서, 분석, 계획 (조회, 제한적 입력/수정)
분석가 및 의사결정자 계층 시스템

2차원, 정규화

다차원, 계층구조

상세 데이터, 중복성 배제

요약 정보, 중복성 수용

소량의 데이터 처리
활용 패턴 단순, 고른 시간대 분포
시스템 자원 사용량 예측 용이

대량의 데이터 처리
활용 패턴 다양, 시간대 불규칙 분포
시스템 자원 사용량 예측 어려움

구축 후 데이터 축적 중심
전통적 개발 주기
시스템 구축 후 유지보수 단순

구축 후 데이터 축적 및 반복 확장 개발 주기
시스템 구축 후 유지보수 전략 필요

사용자 중심 응용프로그램 
Customizing 용이
정형화된 보고서/변경 어려움
단순한 화면 조작

Customizing 제한적
동적인 비정형 분석/변경 용이
EUC(End User Computing) 활성화 필요


 
OLAP 제품 분류

1. MOLAP(Multidimensional OLAP) 
다차원 데이터베이스에 기반한 OLAP 아키텍처. 다차원 데이터의 저장과 프로세싱에 MDB가 사용된다. 타 아키텍처에 비해 네트워크 상의 데이터 이동이 최소화. ⇒ 다차원 데이터의 저장과 프로세싱에 동일한 엔진이 사용대표적인 제품 : 하이페리언 솔루션의 에스베이스, 오라클의 익스프레스, 파일롯 소프트웨어의 디시젼 서포트 등
2. ROLAP(Relational OLAP)
관계형 데이터베이스에 기반한 OLAP 아키텍처. 관계형 데이터와 클라이언트 사이의 연결역할을 수행. 대표적인 제품 : 인포믹스의 메타큐브, 인포메이션 어드벤티지의 디시전 쉬이트, 마이크로스트래 티지의 DSS에이젼트 등이 있다.
3. DOLAP(Desktop OLAP)
다차원 데이터의 저장 및 프로세싱이 모두 클라이언트에서 이루어지 는 데이터베이스.장점) 타 OLAP제품에 비해 비교적 설치와 관리가 쉽고 유지 보수가 용이 단점) 필요한 데이터가 모두 클라이언트로 이동될 필요 대용량 데이터 처리에 한계대표적인 제품 : 코그노스의 파워플레이, 브리오 테크놀러지의 브리오쿼리 등이 있다
4. HOLAP(Hybrid OLAP) 
다차원 데이터의 저장 공간으로 다차원 데이터베이스와 관계형 데이터 베이스가 함께 사용될 수 있는 제품. 일반적으로 요약된 데이터나 관계식5에 의해 새로 계산된 데이터는 다차원 데이터베이스에 저 장되며, 상세데이터는 관계형 데이터베이스에 저장.대표적인 제품 : 오라클의 익스프레스, 마이크로소프트의 SQL서버 OLAP 등이다. 


다차원모델의 구성 

1. 모델
하나의 큐브(Cube), 예로 아래그림은 매출분석모델의 큐브이다.
2. 차원(Dimension)
큐브를 구성하는 축(Axis)이다. 매출분석 모델은 변수, 매장, 제품이라는 3개 차원으로 구성된 큐브이다.
3. 차원 항목(Member 혹은 Element)
각 축의 좌표에 해당하는 것이다. 매출분석모델에서 살펴보면 제품 차원은 냉장고, 세탁기 등의 항목으로, 매장 차원은 반포, 잠실 등의 항목이 있다
4. 셀(Cell) 
사용자 삽입 이미지

사용자 삽입 이미지

5. 계층구조(Hierachy)
 
다차원 모델을 구성하는 대부분의 차원들은 일반적으로 계층구조를 가진다. 계층구조는 레벨들 간에 혹은 항목들간에 존재할 수 있다. 항목들간의 가장 기본적인 관계는 패어런트(Parent)-챠일드(Child)관계이다. 패어런트는 계층구조에서 어떤 항목의 바로 상위항목을 나타내며, 챠일드는 바로 하위항목에 해당한다. 
6. 레벨
계층구조는 레벨(Level) 사이에 존재 할 수 있는데, 예를 들어 기간 차원의 경우 
         '일-월-분기-반기-년'과 같은 다단계(레벨) 계층구조가 존재할 수 있다. 
사용자 삽입 이미지



OLAP의 장점과 단점 

장점
- 강력한 시각화 도구
- 빠른,상호 교환적인 응답시간
- 통계량을 분석함에 편리함
- 자료를 찾기에 유용하다
- 많은 곳에서 OLAP제품을 제공한다
- 운영자의 프로그램 유지보수 비용의 최소화
- 프로그램 운영부담의 경감

단점
- 입방체를 설정하는 것은 어려울 수도 있다
- 지속적인 변수들은 취급하지 않는다.
- 입방체 자료의 가치가 쉽게 떨어 질 수 있다
- 고객의 불만을 들어 주기 어렵다.





성공사례 (군단 전선관측 자료분석 시스템  

OLAP 도입전
관측된 자료가 정보화가 되기까지 수작업에 의존
수작업에 의존하는 데이터 분석방식은 투입되는 시간과 노력에 비해 비효율적
정보실무자는 특정활동에 국한된 자료를 이용하여 단순통계를 구하고 분석할수밖에 없었음

OLAP 도입후
필요한 정보의 수집자산별, 첩보내용별로 구조화
과학적인 분석을 통해 적활동을 신속하고 정확하게 파악
복잡하게 느껴지던 분석업무의 체계화
보고서 작성의 최소화
전선관측 정보를 새로운 관점에서 보게 됨






성공사례 (록히드 마틴) 

OLAP 도입전
록히드의 부서는 종업원들과 business-management 정보, 신입 사원 및 관리직의 모집 정보, 위험과 전문적인 광고효과의 측정, 판매 그리고 예산비용, 그리고 고가 분석에 대한 프로그램을 만들기 위하여 접근 방법을 제공하는 것이 필요했다.

OLAP 도입후

OLAP 도입후 회사는 중요한 사업 자료로부터 높은 수준의 보안을 필요로 했다. 상당한 노력으로 안전하게 자료를 보관할 수 있었고, 인증된 사용자들을 포함하여 접근자 들의 자료 접근을 분명히 하는 것에 효과적이었다. 결과적으로, 시스템 관리자들은 효율적으로 통제할 수 있었다. 그리고 OLAP 적용으로 인해 많은 외부의 사용자들이 자료와 상호 작용할 수 있는지를 관리할 수 있게 되었다


출처 : http://cafe.naver.com/sybaseealab/527

'Data Architecture' 카테고리의 다른 글

Power Designer와 ERWin의 비교  (0) 2012.02.16
12인이 말하는 ‘아키텍트의 길’  (0) 2010.11.05
The Nine Circles of Data Quality Hell  (0) 2010.08.13
:     

TISTORY에 Login하려면 여기를 누르세요.