본문 바로가기
공부/R Programming

Data Science Week 03 - 01

by 혼밥맨 2021. 3. 18.
반응형

Data Science Week 03

 

# Import swimming_pools.csv : pools

pools <- read.csv('swimming_pools.csv')

 

# Print the structure of pools

str(pools) #데이터의 열이 character로 이루어져 있다면 기본적으로 Factor type으로 불러온다

 

 

# 데이터의 열을 Factor type으로 불러오고 싶지 않다면 stringAsFactor를 FALSE로 한다.

pools <- read.csv('swimming_pools.csv', stringAsFactors = FALSE)

 

# Check the structure of pools

str(pools)

 

 

## Converting Types Afterward ##

# 데이터를 import할 때 "stringAsFactor = FALSE"로 하기 싫지만 열을 Factor type에서 character type으로 변경하고 싶을 때 변환하는 방법

pools <- read.csv('swimming_pools.csv')

 

# pools 데이터프레임의 캐릭터 열은 자동적으로 Factor로 불러와졌지만, as.character 이용함으로써 Factor Type에서 character type으로 변환했음.

pools$Name <- as.character(pools$Name)

pools$Address <- as.character(pools$Address)

 

# Print the structure of pools

str(pools)

 

 

----------

## read.table

 - Read any tabular file as a data frame

 - Number of arguments is huge

 

 > read.table("state2.txt",

                  header = FALSE,             # first row lists variable names (default FALSE)

                  stringAsFactor = FALSE)   # field separator is a forward slash

 

example

 > hotdogs <- read.table('hotdogs.txt',

                                  sep = '\t')

 

# Call head() on hotdogs

head(hotdogs)

 

# 헤더가 없는 txt 파일을 읽으면 자동으로 V1 V2 V3 ... 으로 지정됨

## V1 V2 V3

 

# txt file을 import 할 때 열의 이름 지정하기

hotdogs <- read.table('hotdogs.txt', sep = '\t',

                              col.names <- c('type', 'calories', 'sodium'))

 

str(hotdogs)

 

# add new variable named 'cal.type'

hotdogs$cal.type <- ifelse(hotdogs$calories >= 150, 'heavy', 'light')

head(hotdogs)

 

##      type calories sodium cal.type

## 1   Beef      186     495    heavy

## 2   Beef      181     477    heavy

## 3   Beef      176     425    heavy

 

 

-------

## Exporting Data Frame as tsv file

write.table(hotdogs, "newhotdog.tsv", row.names = F, sep = '\t')

 

----------------

## Save your variable as a File

 - Any type of R variables can be saved in RData file

 - save(var1, var2, ..., file = "myfile.RData")

 

example

my.var <- 10

my.var2 <- c(1, 4, 6, 22, 3)

my.var3 <- c('John', 'Bob', 'Alice')

my.var4 <- data.frame(A=1:3, B=9:11)

 

save(my.var, my.var2, my.var3, my.var4,

      file = 'myVariables.RData')

 

-----------

Clean Your Workspace

rm(list = ls())

or press sweep button

 

-----------

Load Your Variables Back

load('myVariables.RData')

 

-----------

Saving working environment as a file

 - To save everything in your working environment

 

save(list = ls(), file = "myWork.RData")

or press disk button

 

 

 

-----------

 

 

반응형

댓글