본문 바로가기

파이썬

[plt]scatter_plot(데이터 시각화: 파이썬 matplotlib을 활용한 예시)

반응형

오늘은 matplotlib을 사용해서 scatterplot을 그려보는 방법을 정리해보려함!

저번 주는 논문 figure 만드느라 바빴다.

 

import matplotlib.pyplot as plt

일단 matplotlib import해오고

sample_list = [1.2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,10]

scatter 그릴 sample을 list로 만든다.

def scatter_plot(list):
  plt.scatter(range(len(sample_list)), sample_list, s=10, alpha=0.9)
  plt.xlabel("sample Index")
  plt.ylabel("size")
  plt.title("sample size")
  plt.show()

scatter_plot이라는 함수를 따로 만들었고, s 옵션은 point 크기, alpha는 투명도

scatter_plot(sample_list)

이렇게 간단하게 나타낼 수 있음.

실수로 sample list를 20이 아니라 10으로 입력했는데

맨 마지막에 뚝 떨어지는거 보니

x축은 리스트 요소 순서대로 입력하는 것 같다.

scatter plot에서 index x축이 의미하는 바가 항상 궁금했는데

해결완료!!

import random
random.shuffle(sample_list)
scatter_plot(sample_list)

가지고 있는 sample을 shuffle로 random화 해서

다시 scatter plot을 그려봤는데

 


리간드의 volume의 size를 대략 확인하기 위해

scatterplot을 사용해봤다.


scatter는 산점도(Scatter plot)를 생성하는 함수입니다.
산점도는 두 변수 간의 관계를 시각화하는 데 사용되는 그래프 형식입니다.

산점도는 데이터의 분포를 보여주고, 두 변수 간의 상관 관계를 파악하는 데 유용합니다.
각 데이터 포인트는 그래프 상에 점으로 나타나며, x축과 y축에 대응하는 두 변수의 값을 나타냅니다.
데이터 포인트들이 그래프 상에서 어떻게 분포하는지를 시각적으로 확인할 수 있습니다.

scatter 함수를 사용하여 산점도를 그릴 때, x축과 y축에 해당하는 데이터를 인자로 전달하고,
필요에 따라 점의 크기, 색상 등을 지정할 수 있습니다. 이를 통해 데이터 간의 패턴이나 관계를 시각적으로 파악할 수 있습니다.

예를 들어, 다음은 scatter 함수를 사용하여 x축과 y축에 대응하는 두 변수 간의 관계를 산점도로 그리는 간단한 예입니다:

import matplotlib.pyplot as plt

x = [1, 2, 3, 4, 5]

y = [10, 7, 3, 8, 5]

plt.scatter(x, y)

plt.xlabel('X')

plt.ylabel('Y')

plt.title('Scatter Plot')

plt.show()

X와 Y의 상관관계를 확인하기에는

리스트 내 요소가 부족한 것 같아서


 

import numpy as np import matplotlib.pyplot as plt # 난수 생성

np.random.seed(1)

x = np.random.randn(100) # 평균 0, 표준편차 1인 정규분포에서 랜덤한 값 생성

y = 2 * x + np.random.randn(100) # y = 2x + 랜덤한 값 # 산점도 그리기

plt.scatter(x, y)

plt.xlabel('X')

plt.ylabel('Y')

plt.title('Scatter Plot')

plt.show()

조금 더 명확하게 시각화할 수 있는 

예시를 추가해봤다.

numpy 라이브러리를 사용하여

랜덤한 데이터를 생성하고

scatter 함수를 사용해 산점도를 그린다.

 

반응형