공부
-
크롤링으로 교보문고, 리디북스 책 목록 가져오기, 데이터프레임만들기, 엑셀로 저장하기!!!공부/Python 2021. 7. 27. 00:20
순서 1. 리디북스 베스트셀러 책 목록 가져오기 2. 교보문고 베스트셀러 책 목록 가져오기 3. 교보문고 베스트셀러 책 목록, 저자, 가격 가져오기 4. 3에서 가져온 리스트들을 데이트 프레임으로 만들기 5. 만든 데이터 프레임을 엑셀로 저장하기 1. 먼저 리디북스 부터 해본다. 해당 부분은 https://hyongdoc.tistory.com/191 블로그를 참고했다. 1. 필요한 패키지 불러오기 import requests # 웹페이지를 불러오기 위한 패키지 import lxml.html 여기서 lxml은 Python에서 XML parser로서 주로 이용되는 패키지는 로서 음... 그냥 html을 활용하기 위해 쓰인다고 하면 될 거 같다. 2. 웹 페이지 불러오기 url='https://ridibook..
-
[Python]_시각화_Matplotlib_hist, pie 그래프 그리기공부/Python 2021. 6. 25. 21:26
1. hist 히스토그램은 구간별 빈도수를 나타내는 그래프로, x축은 구간(bins), y축은 빈도로 나타낸다. 기본 형태는 plt.hist(x, bins=) 이다. 기본 예제로 10000개의 숫자에 대해서 구간을 30개로 나눠 히스토그램을 그려보자. 1-2. y축 변경_퍼센트로 나타내기 hist 옵션에서 density=True로 하면 y축이 퍼센트 비율로 바뀌게 된다. 1-3. y축 변경_누적 막대그래프로 나타내기 hist옵션에서 cumulative=True를 설정하면 누적막대그래프로 나타낼 수 있다. 2. pie 점유율을 나타낼사 사용하는 그래프로 4-5개의 데이터에 대해 나타날 때 적당하다. 기본 형태는 아래와 같다. 몇 가지 옵션에 대해 알아보고 이를 활용한 그래프를 그려본다. * explode:..
-
[Python]_시각화_Matplotlib_lineplot,areaplot공부/Python 2021. 6. 16. 21:50
1. line plot 기본 형태는 plot.plot(x, y)이다. sin그래프를 그려보자. 1-2. 하나의 캠퍼스에 두 개의 lineplot 그리기 두개의 plot을 그리면 된다. 1-3 marker, linestyle 옵션 주기 더 많은 marker와 linestyle 옵션 내용은 https://matplotlib.org/를 참고 바란다. 2. Area plot area plot은 line으로 그려진 그래프 아래를 색칠하는 그래프다 matplotlib에서 area plot을 그리고자 할 때는 fill_between 함수를 사용합니다. 먼저 numpy.random.randint(low, high, size= )은 low~high-1까지의 숫자를 size만큼 만들어낸다를 의미한다. 사이즈에는 size=..
-
[Python]_시각화_Matplotlib_Barplot, Barhplot공부/Python 2021. 6. 9. 22:33
1. Barplot_막대그래프 기본적인 코드는 plt.bar(x, y)으로 x와 y값이 필요하다. x에는 '과목' , y는 과목에 대한 '점수'라는 데이터를 통해 과목별 점수 Bar그래프를 그려보자. 여기에 스타일 옵션을 주어 그래프를 보기좋게 만들어보자. align, alpha, color 2. barh_수평 막대그래프 수평 바 그래프로 bar plot을 수평으로 바꾸어 본다고 생각하면 된다. x축에 들어갈 내용이 길어 겹쳐 보일 때 수평 바 그래프로 보면 된다 기본 내용은 bar와 같고 오직 다른 점은 plt.yticks()에 x값을 넣어주면 된다. 3. bar로 비교 그래프 그리기 철수, 영희의 과목별 점수를 한 그래프에서 비교해본다고 하자 일단 철수, 영희 각각 두 개의 데이터가 필요하고, 막대 ..
-
[Python]_시각화_Matplotlib_Scatter_s,c,cmap,alpha옵션 적용공부/Python 2021. 6. 8. 22:04
1. Scatter(산점도) 산점도는 두 변수의 관계를 나타내는 것으로 이를 통해 양의 상관관계, 음의 상관관계, 관계없음을 알 수 있다. 아래 사이트에 들어가 보면 Scatter에 기본적인 내용과 예제에 대해서 볼 수 있다. https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.scatter.html?highlight=scatter#matplotlib.pyplot.scatter matplotlib.pyplot.scatter — Matplotlib 3.4.2 documentation Parameters: x, yfloat or array-like, shape (n, )The data positions. sfloat or array-like, shape..
-
[Python]시각화_Matplotlib_스타일 옵션[완성]공부/Python 2021. 6. 8. 10:17
아래 그림과 깉이 기본적인 그래프 정보를 알 수 있다. 스타일 옵션 1. Title, fontsize 2. X,Y 축 lable 3. X,Y 축 Tick (rotation) 4. 범례 (legend) 5. X,Y 축 limit 설정 - 확대해서 잘러서 보는 거 가능 6. 스타일 세부 설정 - marker,markersize '.' point marker ',' pixel marker 'o' circle marker 'v' triangle_down marker '^' triangle_up marker '' triangle_right marker '1' tri_down marker '2' tri_up marker '3' tri_left marker '4' tri_right marker 's ' square ..
-
[Python]_시각화_Matplotlib_plot,figure, subplot, subplots공부/Python 2021. 6. 7. 13:46
[기본 형태] 1) 데이터 생성 2) 도화지에 데이터 넣어주기 3) 그래프를 그린다. 1. plt.plot(데이터) 단일 그래프 그리기 data = np.arrange (1,100) plt.plot(data) plot.show() - 1개의 캔버스 안에 다중 그래프 그리기 :n개의 데이터를 생성하고 이를 플롯에 다 그려주면 된다. data = np.arange(1, 51) data2 = np.arange(51, 101) plt.plot(data) plt.plot(data2) plt.show() 2. plt.figure() : 도화지를 추가하여 다중 그래프 그린다 data = np.arange(100, 201) plt.plot(data) data2 = np.arange(200, 301) plt.figure..
-
[Python]_코랩 한글깨짐 문제공부/Python 2021. 6. 7. 12:35
[코랩 한글 깨짐 문제 해결] 1. 그림과 같이 범례 부분 한글 깨지는 문제 발생 2. 아래코드 실행 !sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf 3. 상단 메뉴 - 런타임 - 런타임 다시 시작을 클릭 4. 아래 코드 한 번더 실행 import matplotlib.pyplot as plt plt.rc('font', family='NanumBarunGothic') 5. 다시 코드 실행해서 plot 하면 된다. 다음과 같이 범례부분 한글이 잘 나온 것을 볼 수 있다