Notice
Recent Posts
Recent Comments
Link
«   2025/02   »
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28
Tags
more
Archives
Today
Total
관리 메뉴

개발자입니다

섹션 4. Chapter 04 데이터 수집 (Youtube HelloJany) 본문

R

섹션 4. Chapter 04 데이터 수집 (Youtube HelloJany)

끈기JK 2022. 9. 7. 09:46

-원시 자료 입력

일반적으로 잘쓰진 않음

 

-read_excel 함수로 excel파일 가져오기

 

install.packages("readxl")  # readxl 패키지 설치
library(readxl)  # readxl 불러오기

excel_data_ex <- read_excel("C:/Rstudy/data_ex.xls") # data_ex.xls 파일을 excel_data_ex로 저장

 

-read.table() 함수로 txt파일 가져오기

: txt 파일 다른이름으로 저장해서 UTF-8 → ANSI 로 바꾸면 에러 해결

ex_data <- read.table("C:/Rstudy/data_ex.txt") # data_ex.txt 파일을 ex_data로 저장
View(ex_data) # excel_data_ex 조회

# header 옵션으로 변수명 유무 설정 후 ex_data1로 저장
ex_data1 <- read.table("C:/Rstudy/data_ex.txt", header = TRUE)
View(ex_data1) # ex_data1 조회

# skip 옵션으로 가져올 시작 위치 지정 후 ex_data2로 저장
ex_data2 <- read.table("C:/Rstudy/data_ex.txt", header = TRUE, skip = 2)
View(ex_data2) # ex_data2 조회

# nrows 옵션으로 불러올 행의 개수 지정 후 ex_data3으로 저장
ex_data3 <- read.table("C:/Rstudy/data_ex.txt", header = TRUE, nrows = 7)
View(ex_data3) # ex_data3 조회

# sep 옵션으로 구분자 지정 후 ex1_data로 저장
ex1_data <- read.table("C:/Rstudy/data_ex1.txt", header = TRUE, sep = ",")
View(ex1_data)

varname <- c("ID", "SEX", "AGE", "AREA") # 변수명으로 사용할 값을 varname 변수에 할당

# col.names 옵션으로 변수명(varname 변수의 데이터 값) 지정 후 ex2_data로 저장
ex2_data <- read.table("C:/Rstudy/data_ex2.txt", header = TRUE, sep = ",", col.names = varname)
View(ex2_data) # ex2_data 조회

View(ex_data), View(ex_data) : header = TRUE, VIEW(ex1_data) : sep = ",", View(ex2_data) : col.names = varname

view(ex_data2) : skip = 2

view(ex_data3) : nrows = 7

 

-직관적인 메뉴로 원시데이터 가져오기

: txt, csv, excel 파일 import

Separator: Tab, Comma 등 선택

결측 데이터 있을 경우: na.strings에 NA 입력

 

-데이터 저장하고 불러오기

변수 rda 파일로 저장, 불러오기

save(data_ex, file = "data_ex.rda") # Rstudio Environment의 데이터 저장
load("C:/Rstudy/data_ex.rda") # 위 데이터 불러오기

 

csv파일로 저장

write.csv(data_ex, file = "C:/Rstudy/data_ex.csv")