R
R(생물정보학특론)-2(mpg 데이터로 scatterplot 그리기)[feat.chain&RMSD_scatterplot]
anna-conda
2023. 6. 9. 14:02
반응형
mpg data
: manufacturer / model / displ / year / cyl / trans / drv / cty / hwy / fl / class
- displ - 엔진 크기(단위:리터)
- hwy - 고속도로에서의 자동차 연비(단위:갤런 당 마일, mpg)
View(mpg) :
[R] 데이터 분석 기초함수 - View() , dim() , str()
ggplot(data = mpg) +geom_point(mapping =aes(x =displ,y =hwy))
가지고 있는 데이터 사용해서 그래프 그려보기!
check_final 데이터는
rmsd_info를 담은 csv 형태의 dataframe으로
: PDB_code / Chain / UniProt_ID / RMSD
컬럼을 가진다.
rmsd_info<-read_csv("check_final.csv")
rmsd_info를 불러오면 다음과 같다.
각 Chain별 RMSD 정보가 매칭되어있는데
이 데이터를 가지고 위의 mpg 데이터와 같이 분석해봤다.
ggplot(data =rmsd_info) +geom_point(mapping =aes(x =Chain,y =RMSD))
Chain이 숫자로는 1,2,3,4 문자로는 A~Z가 대문자 소문자 섞여있나보다.
숫자도 그렇고 문자도 그렇고 후반부로 갈 수록
RMSD가 낮아지는 듯한 양상을 보이는데?
ggplot(data =rmsd_info) +geom_point(mapping =aes(x =Chain,y =RMSD),alpha =0.1)
alpha로 투명도로 조금 조절을 하니
더 명확하게 이를 확인할 수 있었다.
반응형