프로그래밍독학
-
[Python]_06_pandas_부동산 데이터를 활용한 예제, str.strip(), ,str.replact(),fillna, index를 활용한 drop공부/Python 2021. 6. 3. 14:51
ValueError: invalid literal for int() with base 10: ' ' 1칸 or 2칸 공백이 있음을 의미한다. df['분양가격'] = df['분양가격'].str.strip() # 공백을 제거해준다 ValueError: invalid literal for int() with base 10: '' 공백을 의미한다. df.loc[ df['분양가격'] == '', '분양가격'] = 0 # loc를 이용해 공백에 0을 넣어준다. ValueError: cannot convert float NaN to integer 값이 없음을 의미한다. df['분양가격']=df['분양가격'].fillna(0) # Nan값에 0을 넣어준다. ValueError: invalid literal for in..
-
[Python]_pandas_04_fillna,inplace,dropna,drop,drop_duplicates공부/Python 2021. 5. 31. 21:53
1. df.fillna(넣을 값) 해당 값 저장 방법 2가지 1-1. inplace= True 사용 df.fillna(넣을 값, inplace= True) inplace= True는 이 값을 저장한다는 의미. inplace=True 없으면 해당 값이 저장이 안 됨 1-2. 변수에 넣어주는 방법 df['컬럼명']=df['컬럼명'].fillna(넣을 값) 2. Dorp 2-1.NaN값에 대해 행전체 제거 df.dropna(axis =0 or 1,how='any'or'all') axis = 0: 행, =1: 열 any:행에 하나라도 NaN값이 있다면 행 전체 제거 all:모든 행이 NaN이면 행 전체 제거 2. NaN의 중복된 값을 제거 df.drop_duplicates(keep='last' or 'first..
-
[Python]_02_pandas_컬럼선택,loc,iloc,isin,isna,isnull,notnull,공부/Python 2021. 5. 27. 17:46
_※ colab을 사용 ※ 파일 업로드 방식은 여러 가지가 있지만 구글 드라이브를 사용함. ※ 아직 왕 초보라 틀린 부분이 있을 수도 있습니다. 혹시 발견하신다면 댓글로 알려주세요. ※ 복습용으로 간략하게 써놓은 부분입니다. 혹시 좀 더 자세히 알고 싶으신 부분이 있다면 댓글 남겨주세요. 알고 있는 내용 한에서 알려드리겠습니다.!!! # 강의 6,7,8,9 1. 컬럼 선택 방법 # 이름 컬럼에 대해 모든 행 뽑아라 (3가지 방법) df['이름'] df["이름"] df.이름 # 추천하지 않음. 2. loc / iloc - loc : 컬럼을 문자로 표현 가능 - iloc : 숫자로만 표현 가능 ### loc 이용 # 모든 데이터 뽑아라 df.loc[:] # 이름, 키 컬럼에 대한 모든 행데이터 뽑아라 df...
-
[Python]_01_pandas_구글드라이브 파일업로드,column재정의, info, describe, shape, head, tail, sort공부/Python 2021. 5. 26. 16:27
_※ colab을 사용 ※ 파일 업로드 방식은 여러 가지가 있지만 구글 드라이브를 사용함. ※ 아직 왕 초보라 틀린 부분이 있을 수도 있습니다. 혹시 발견하신다면 댓글로 알려주세요. ※ 복습용으로 간략하게 써놓은 부분입니다. 혹시 좀 더 자세히 알고 싶으신 부분이 있다면 댓글 남겨주세요. 알고 있는 내용 한에서 알려드리겠습니다.!!! 1. pandas import, 구글 드라이브로부터 csv 파일 불러오기 import pandas as pd from google.colab import drive # colab사용, 구글 드라이브 사용 drive.mount('/content/drive') filename='파일경로' df=pd.read_csv(filename) # 파일을 df 변수에 넣어줌 2. 기본정보(..