오늘은 matplotlib을 사용해서 scatterplot을 그려보는 방법을 정리해보려함!
저번 주는 논문 figure 만드느라 바빴다.
일단 matplotlib import해오고
scatter 그릴 sample을 list로 만든다.
scatter_plot이라는 함수를 따로 만들었고, s 옵션은 point 크기, alpha는 투명도
이렇게 간단하게 나타낼 수 있음.
실수로 sample list를 20이 아니라 10으로 입력했는데
맨 마지막에 뚝 떨어지는거 보니
x축은 리스트 요소 순서대로 입력하는 것 같다.
scatter plot에서 index x축이 의미하는 바가 항상 궁금했는데
해결완료!!
가지고 있는 sample을 shuffle로 random화 해서
다시 scatter plot을 그려봤는데
리간드의 volume의 size를 대략 확인하기 위해
scatterplot을 사용해봤다.
scatter는 산점도(Scatter plot)를 생성하는 함수입니다. 산점도는 두 변수 간의 관계를 시각화하는 데 사용되는 그래프 형식입니다. 산점도는 데이터의 분포를 보여주고, 두 변수 간의 상관 관계를 파악하는 데 유용합니다. 각 데이터 포인트는 그래프 상에 점으로 나타나며, x축과 y축에 대응하는 두 변수의 값을 나타냅니다. 데이터 포인트들이 그래프 상에서 어떻게 분포하는지를 시각적으로 확인할 수 있습니다. scatter 함수를 사용하여 산점도를 그릴 때, x축과 y축에 해당하는 데이터를 인자로 전달하고, 필요에 따라 점의 크기, 색상 등을 지정할 수 있습니다. 이를 통해 데이터 간의 패턴이나 관계를 시각적으로 파악할 수 있습니다. 예를 들어, 다음은 scatter 함수를 사용하여 x축과 y축에 대응하는 두 변수 간의 관계를 산점도로 그리는 간단한 예입니다: |
import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5]
y = [10, 7, 3, 8, 5]
plt.scatter(x, y)
plt.xlabel('X')
plt.ylabel('Y')
plt.title('Scatter Plot')
plt.show()
X와 Y의 상관관계를 확인하기에는
리스트 내 요소가 부족한 것 같아서
import numpy as np import matplotlib.pyplot as plt # 난수 생성
np.random.seed(1)
x = np.random.randn(100) # 평균 0, 표준편차 1인 정규분포에서 랜덤한 값 생성
y = 2 * x + np.random.randn(100) # y = 2x + 랜덤한 값 # 산점도 그리기
plt.scatter(x, y)
plt.xlabel('X')
plt.ylabel('Y')
plt.title('Scatter Plot')
plt.show()
조금 더 명확하게 시각화할 수 있는
예시를 추가해봤다.
numpy 라이브러리를 사용하여
랜덤한 데이터를 생성하고
scatter 함수를 사용해 산점도를 그린다.
'파이썬' 카테고리의 다른 글
Yaml 파일(config.yaml) 설정 파일(omegaconf 사용해서 참조하도록 응용) (0) | 2025.05.08 |
---|---|
tmux / tqdm 사용법(중단없이 멀티태스킹/진행률 프로그레스바_progress bar) (0) | 2023.08.11 |
excel에서 드래그로 인덱스 증가(숫자 늘리기)[기초] (0) | 2023.06.14 |
main.py(feat_config의 yaml파일)[get_yaml(config_file_path)] (0) | 2023.06.09 |
ChatGPT로 파이썬 공부하는 방법 (1) | 2023.06.09 |