본문 바로가기

R

R(생물정보학특론)-2(mpg 데이터로 scatterplot 그리기)[feat.chain&RMSD_scatterplot]

mpg data

: manufacturer / model / displ / year / cyl / trans / drv / cty / hwy / fl / class 

 

  • displ - 엔진 크기(단위:리터)
  • hwy - 고속도로에서의 자동차 연비(단위:갤런 당 마일, mpg)

View(mpg) : 

mpg data

[R] 데이터 분석 기초함수 - View() , dim() , str()

 

ggplot(data = mpg) +geom_point(mapping =aes(x =displ,y =hwy))

가지고 있는 데이터 사용해서 그래프 그려보기!

 

check_final 데이터는

rmsd_info를 담은 csv 형태의 dataframe으로

: PDB_code / Chain / UniProt_ID / RMSD

컬럼을 가진다.

rmsd_info<-read_csv("check_final.csv")

rmsd_info를 불러오면 다음과 같다.

각 Chain별 RMSD 정보가 매칭되어있는데

이 데이터를 가지고 위의 mpg 데이터와 같이 분석해봤다.

ggplot(data =rmsd_info) +geom_point(mapping =aes(x =Chain,y =RMSD))

Chain이 숫자로는 1,2,3,4 문자로는 A~Z가 대문자 소문자 섞여있나보다.

숫자도 그렇고 문자도 그렇고 후반부로 갈 수록

RMSD가 낮아지는 듯한 양상을 보이는데?

ggplot(data =rmsd_info) +geom_point(mapping =aes(x =Chain,y =RMSD),alpha =0.1)

alpha로 투명도로 조금 조절을 하니

더 명확하게 이를 확인할 수 있었다.

반응형