중간고사 대비 정리

options(scipen=100) df<-df[complete.cases(df$debt) , ] n<-nrow(df) df<-df[complete.cases(df) , ]

pr <- xtabs(~df$V31+df$income)

pr <- as.matrix(pr) round(prop.table(pr,1)*100, 0)

1주차_연구방법론(문제풀이).pdf

1번 출력_PROJECT-1 & PROJECT-2(수정).pdf

2번 출력_학기술정책연구_강의교재.hwp

231021_Library_정리(한주연).pdf

devtools::install_github("ssbaj/aj412s")

Week2 R script

df<-read.csv('자료1.csv', fileEncoding='cp949', encoding='UTF-8')
colnames(df)<-c('id','brand','conv','satprice','age','gender' )
df$gender2 <- df$gender

colnames(df)[7] <- c('gender3')

df<-df[ ,-c(7) ]
df$index <- rownames(df)
df$index <- as.numeric(df$index)

# dplyr : arrange, filter, %>% 
library(dplyr)
df <- df %>% arrange(brand)
df[df=='']<-NA
df <- df %>% arrange(desc(brand))
df <- df %>% arrange( index )

df %>% filter( brand=='SY')
df %>% filter( brand=='SY' | gender==1 )

df %>% group_by(brand) %>% summarize(편의성평균=mean(conv, na.rm=T), n()  )

library(aj412s)
df <- mkdum(df, 2)

unique(df$age)

df<-df[ , -c(8:15)]

df$dum1<-0
df$dum2<-0
df$dum3<-0
df$dum4<-0

for(i in 1:16){
  if(i==4) {
    print("number 4")
    next
      }
  print(i)
  }

n <- nrow(df)
for( i in 1:n){
  if( is.na(df[i,5]))  { next } # NA 처리
  if(df[i,5]==1) { df[i, 8] <- 1 }    # dum1
  else if(df[i,5]==2) { df[i, 9] <- 1 }  # dum2
  else if(df[i,5]==3) { df[i, 10] <- 1 } # dum3
  else if(df[i,5]==4) { df[i, 11] <- 1 } # dum4
}

df[1,5]<-NA

df$dum1<-0
df$dum2<-0
df$dum3<-0
df$dum4<-0

PROJECT-2

∎ ① 재코딩, ② 엑셀의 countif와 동일한 sum(), ③ 변수 type지정 ④ 교차테이블 xtabs(~ )

∎ 엑셀 데이터

자료2.xlsx파일의 3번째 쉬트(Sheet3)에는 54 명의 맥주 소비자들에게 그들이 최근 구매한 맥주에 대해 평가하도록 부탁했다. 변수는 피조사자ID(id), 브랜드(brand), 맛평가(taste), 가격만족도(satprice), 월용돈(allowance), 월구매량(purchase), 성별(gender), 나이(age) 순이다. R로 자료를 로딩하시오.

df <- read_excel(file.choose() , skip=0, sheet=3, col_names=T)

‘성별’의 경우 ①(남성), ②(여성)으로 코딩되었다. 남성은 ‘1’로, 여성은 ‘2’로 재코딩한다.