목록R (10)
개발자입니다
■ ggplot2 패키지 데이터 분석의 꽃, 시각화 -선형그래프 install.packages("ggplot2") library(ggplot2) #airquality 속성 확인 str(airquality) # x축은 Day 열, y축은 Temp 열로 맵핑 ggplot(airquality, aes(x=Day, y=Temp)) #산점도 그리기 ggplot(airquality, aes(x=Day, y=Temp)) + geom_point() # 크기를 3, 색상을 빨강으로 적용하여 산점도 그리기 ggplot(airquality, aes(x=Day, y=Temp)) + geom_point(size = 3, color = "red") # x축을 Day, y축을 Temp로 맵핑한 후 꺾은선그래프 그리기 ggplot(..
■ dplyr 패키지 데이터 가공 마법사 %>% 연산자로 각 조작을 연결할 수 있음 -데이터 추가 및 중복 데이터 제거 library(dplyr, warn.conflicts = FALSE) mtcars str(mtcars) # 데이터의 구조 파악 filter(mtcars, cyl==4) # 데이터에 필터 조건 설정 filter(mtcars, cyl==6 & mpg>20) arrange(mtcars, wt, desc(hp)) # 정렬 head(arrange(mtcars, mpg, desc(wt))) # 정렬 후 앞 5행 출력 select(mtcars, mpg, cyl, carb) # 오류 나는 경우는 다른 패키지 함수 사용하기 때문 # dplyr::select(mtcars, mpg, cyl, carb) 로..
■ KoNLP 패키지 한글을 분석한다 형태소(Morpheme)는 언어에서 뜻을 가진 가장 작은 단위. '사랑'은 뜻이 있으나 '사'와 '랑'은 뜻이 없음 -R 버전 문제로 설치 안될때 KoNLP 패키지 설치 방법 1. 자바 설치 2. rtools40 설치 https://cran.yu.ac.kr/bin/windows/Rtools/ 3. R studio에서 이제 순서대로 설치 및 시행 ## KoNLP 깔기 전에 필요한 패키지들 먼저 설치해줍시다 install.packages("rJava") install.packages("memoise") install.packages("multilinguer") library(rJava) library(memoise) library(multilinguer) install_..
■ reshape2 패키지 데이터의 행을 열로, 열을 행으로 -melt() melt(데이터 세트, id.var = "기준 열", measure.vars = "변환 열") install.packages("reshape2") library(reshape2) str(airquality) head(airquality) # airquality 데이터 세트 확인 names(airquality) names(airquality) melt_test head(melt_test) variable value 1 ozone 41 2 ozone 36 3 ozone 12 4 ozone 18 5 ozone NA 6 ozone 28 > tail(melt_test) # 뒤에서 1행부터 6행까지 출력하기 variable value 913..
패키지: 다른 사람이 미리 구현해놓은 함수 묶음 ■ 주요 패키지와 함수 r-project.org > CRAN > Packages 에서 패키지 확인. 설명 있음 install.pakages()로 다운 받음 -패키지 설치 및 불러오기 install.packages("dplyr") # 설치 library(dplyr) # 불러오기 위 명령어 또는 아래와 같이 Install 및 체크하여 불러오기
■ 연산자 -사칙 연산자: +, -, *, /, %/%(몫), %%(나머지), ^(제곱), **(제곱) -비교 연산자: >, >=, % select(-ID) # ID만 빼고 가져옴 exdata1 %>% filter(AREA=='서울') # AREA가 서울인 데이터만 가져온다 exdata1 %>% filter(AREA=='서울' & Y17_CNT >= 10) # AREA가 서울 & 17_CNT 가 10 이상인 데이터만 가져온다 exdata1 %>% arrange(AGE) # 나이순으로 정렬 exdata1 %>% arrange(desc(AGE)) # 나이순 내림차순으로 정렬 exdata1 %>% summarise(TOT_Y17_AMT = sum(AMT17)) # AMT17 값 합계 표시 exdata1 %>%..