💡Data SourcesOLTP Databases OLTP(Online Transaction Processing) 데이터베이스는 일상적인 트랜잭션 처리를 위한 데이터베이스로, 주로 기업의 운영 시스템에서 발생하는 데이터를 저장하며, 주문 처리, 재고 관리, 고객 정보 관리 등과 같은 실시간 트랜잭션 처리에 주로 사용된다. Enterprise Applicaions엔터프라이즈 애플리케이션은 기업 내부에서 사용되는 다양한 소프트웨어 애플리케이션으로, 주로 기업의 중요한 영역을 관리하고 조직 내의 업무 프로세스를 자동화하는 데 사용된다.대표적인 예로는 ERP, CRM, SCM 등이 있다. 이러한 애플리케이션들은 각각의 영역에 특화된 기능을 제공하여 기업의 생산성과 효율성을 향상한다. ERP (Enterpr..
💡데이터마이닝 분석 절차 프로젝트 설정: 목적 설정과 전략 수립 데이터 획득: 필요한 정보 확보와 다양한 소스 조사 데이터 전처리: 이상치 처리와 형태 가공 데이터 축소: 효율적인 분석을 위한 데이터 샘플링 작업 결정: 분석 목적에 따른 데이터마이닝 작업 선택 데이터 분할: 훈련, 검증, 평가 데이터로 나누기 분석 기법 선택: 회귀분석, 의사결정 나무 등 다양한 기법 중 선택 알고리즘 적용: 선택된 기법에 따라 모델 학습 진행 결과 해석: 모델 결과를 이해하고 비즈니스에 적용할 수 있는 형태로 해석 모델 적용: 실제 비즈니스에 모델 적용하여 성과 확인 1. 데이터마이닝 프로젝트 목적을 정확히 정의한다. 프로젝트 목적: 고객 이탈을 예측하여 조기에 대응하여 이탈률을 감소시킨다. 목적이 명확하지 않으면 프로..
💡비즈니스 애널리틱스 (Business Analytics, BA) 비즈니스 애널리틱스는 데이터를 분석하는 도구와 기법을 의미하며, 데이터를 분석하여 정량적인 정보를 도출한다. 온라인 분석처리(OLAP), 통계기법, 수리적 모델, 데이터마이닝을 통해 미래 예측에 필요한 인사이트를 얻으며, 의사결정자에게 필요한 정량적인 데이터를 산출하여 대응할 수 있도록 한다. 데이터마이닝 (Data Mining, DM) 대량의 데이터 집합으로부터 유용한 정보를 추출하는 것 또는 의미있는 패턴과 규칙을 발견하기 위해서 자동화되거나 반자동화된 도구를 이용하여 대량의 데이터를 탐색하고 분석하는 과정을 의미한다. 데이터마이닝은 계산, 기술통계, 리포팅, 그리고 비즈니스 규칙을 뛰어넘는 고급 분석 방법으로, 복잡한 데이터 속에서 ..
○ 분석 목적 1. 광진구의 주차 문제 해결을 위한 새로운 방안 필요 광진구는 서울특별시에 위치한 지역으로, 인구 밀도가 높아 특히 주차 문제가 빈번하게 발생한다. 차량수의 증가에 비례하여 불법 주정차는 매년 증가하고 있다. 또한 그에 따라 불편 신고 건수도 꾸준히 늘어나는 추세이다. 이에 광진구는 '거주자 우선 주차 공유사업'을 실시하는 등 주차 문제를 해결하기 위해서 다양한 정책을 시도하고 있으나, 주차난은 여전히 광진구가 해결해야 하는 문제 중 하나이다. 이를 해결하기 위해서는 더욱 체계적인 분석을 바탕으로 지속적이고 실현 가능한 방안을 세워야 한다. 2. 공공데이터를 활용하여 광진구의 주차 문제 파악 및 정책 제시 타 지역에서의 문제 해결 과정을 살펴본 결과, 공공데이터를 활용하여 사람들의 불편을..
1. 기본 package 설정 # install.packages("tidyverse") # install.packages("tidytext") library(KoNLP) useNIADic() # 단어사전 library(tidyverse) library(tidytext) 2. 단어 빈도 및 퍼센테이지(%) 계산 word_count % count(word, sort = TRUE) %>% mutate(prop = n / sum(n)) %>% ungroup() word_count 3. 단어 확인 3-1. 전체 데이터 확인 word_count %>% slice_max(n, n = 100) %>% print(n = 100) 3-2. 전체 데이터에서 상위 100개만 확인 word_count %>% slice_max(..