R Programming

Programming/R

R Programming Web Crawling 워드클라우드

1. 기본 package 설정 # install.packages("ggwordcloud") library(ggwordcloud) 2. 실행 시 매번 다르게 그려지도록 설정 set.seed(123) color % slice_max(n, n = 50)), replace = TRUE) 3. 흑백으로 그리기 set.seed(123) word_count %>% filter(n > 20) %>% ggplot(mapping = aes(label = word, size = n)) + geom_text_wordcloud_area() + scale_size_area(max_size = 20) + theme_minimal() 4. 여러가지 색으로 그리기 set.seed(123) color % filter(n > 20)), ..

Programming/R

R Programming Web Crawling 단어 빈도 분석

1. 기본 package 설정 # install.packages("tidyverse") # install.packages("tidytext") library(KoNLP) useNIADic() # 단어사전 library(tidyverse) library(tidytext) 2. 단어 빈도 및 퍼센테이지(%) 계산 word_count % count(word, sort = TRUE) %>% mutate(prop = n / sum(n)) %>% ungroup() word_count 3. 단어 확인 3-1. 전체 데이터 확인 word_count %>% slice_max(n, n = 100) %>% print(n = 100) 3-2. 전체 데이터에서 상위 100개만 확인 word_count %>% slice_max(..

Programming/R

R Programming Web Crawling 형태소 분석

1. 기본 package 설정 # install.packages("tidyverse") # install.packages("tidytext") useNIADic() # 단어사전 library(KoNLP) library(tidyverse) library(tidytext) 2. 데이터 가져오기 tm_tb % # 엔터 등 제거 mutate(본문 = gsub("[[:punct:]]", " ", 본문)) %>% # 구두점 등 제거 mutate(본문 = gsub("[[:digit:]]", "", 본문)) # 숫자 제거 tm_tb$본문[2] ✔️ 정규표현식 ✔️ mutate(본문 = gsub("", "", 본문)) ✔️ 무엇을 출력할지는 내용을 보면서 생각해 봐야 한다. ✔️ [:cntrl:]: 제어문자 [\x00-..

Programming/R

R Programming Web Crawling 데이터 수집 (네이버 기사)

기사 데이터를 수집하는 방법으로 아래 3가지를 제시한다. 1. 데이터를 하나만 가져오는 방법 2. 여러 페이지의 데이터를 가져오는 방법 3. 조건을 설정하여 데이터를 가져오는 방법 3가지 방법을 구현하는 코드는 거의 비슷하지만 상이한 부분에 대해서는 디버깅을 통해 문제를 해결하는 능력이 필요하다. 1. 기본 package 설정 # 1. 기본 package 설치 library(tidyverse) library(rvest) ✔️ install.packages("") 2. 데이터를 하나만 가져오는 방법 2-1. 검색어 설정 # 2-1. 검색어 설정 search_url % # sp_nws1 > div > div > div.news_info > div.info_group > a:nth-child(3)" 앞부분 제..

Programming/R

R Programming 종합만족도 분석 및 IPA 계산

강서대학교 학생 대상 강서01 버스 이용 만족도 분석 isaac-christian.tistory.com 강서대학교 학생 대상 강서01 버스 이용 만족도 분석에 사용한 소스코드이다. 직접 만족도 설문지를 만들고, 항목 및 차원 만족도와 IPA 분석을 진행하면서 R언어 이해도를 높일 수 있었다. 1. 기본 package 설정 # 1. 기본 package 설정 library(tidyverse) library(tidymodels) library(rstatix) library(skimr) library(FSA) library(ggpubr) library(rpart) library(rpart.plot) library(caret) library(tree) # install.packages("") 2. 데이터 불러오기..

Programming/R

R Programming 만족도 지수 계산

1. 기본 package 설정 # 1. 기본 package 설정 library(tidyverse) library(tidymodels) library(rstatix) library(skimr) ❇️ tidyverse: 데이터 분석과 시각화를 위한 여러 R 패키지를 모아놓은 패키지 - dplyr, ggplot2, tidyr, purrr, stringr 등을 포함하고 있으며, 데이터 전처리, 조작, 시각화 등에 사용 ❇️ tidymodels: tidyverse와 마찬가지로 데이터 분석에 필요한 R 패키지를 모아놓은 패키지 - parsnip, recipes, rsample, dials, yardstick 등이 있으며, 머신러닝 모델 제작, 평가, 비교에 사용 ❇️ rstatix: 데이터 분석을 위한 통계 분석 ..

Isaac-Christian
'R Programming' 태그의 글 목록