공부
-
[Python]_numpy_배열만들기, indexing, slicing공부/Python 2021. 6. 3. 22:27
1. 다차원 배열 만들기 np.array shape #1차원 배열 만들기 넘파이_배열1=np.array([1,2,3,4]) #2차원 배열 만들기 넘파이_배열2 = np.array([[1,2,3,4],[11,12,13,14]]) #3차원 배열 생성하기 넘파이_배열3 = np.array([ [[1,2,3,4],[11,12,13,14]], [[21,22,23,24],[31,32,33,34]] ]) 넘파이_배열3.shape #모양 알아보기 # 3차원 데이터는 (묶음, 행, 열)로 이해하면 될 것 같다 . 2. 0 or 1 or 랜덤숫자로 채운 배열 만들기 np.zeros np.ones np.random() zero=np.zeros([4]) one=np.ones([3,4]) random=np.random.rand..
-
[2021년 1회 정보처리기사 실기 독학 후기]공부/자격증 2021. 6. 3. 16:39
[시험 준비] 2021년 1회 정보처리기사 필기를 합격했다. 일단 나에게 주어진 시간은 2-3주였고, 주말을 제외하고 하루 많아야 3시간 정도 공부했다. 범위도 너무 넓고 주관식으로 출제되는 문제를 대비하기 위해서 암기해야 하는 것들이 너무 많았다. 2-3주 동안 방대한 암기와, SQL, 프로그래밍, 알고리즘 모두를 잡는 건 힘들고 판단하여 시험 1주일 전 기출문제만을 보며 SQL, 프로그래밍, 알고리즘을 공부했다. 생각보다 답이 간단한 면도 있었고, 시간적으로 비효율적이라고 생각했기 때문이다. 무엇보다도 프로그래밍에 시간을 쏟을 시간이 부족했다. 참고로 나는 비전공자로써 C언어, 자바를 해본 적이 없고 파이썬은 그냥 접해본 정도뿐이다. [시험후기] 시험시간은 13? 시였나? 수험표에 13시 시험이고 1..
-
[Python]_06_pandas_부동산 데이터를 활용한 예제, str.strip(), ,str.replact(),fillna, index를 활용한 drop공부/Python 2021. 6. 3. 14:51
ValueError: invalid literal for int() with base 10: ' ' 1칸 or 2칸 공백이 있음을 의미한다. df['분양가격'] = df['분양가격'].str.strip() # 공백을 제거해준다 ValueError: invalid literal for int() with base 10: '' 공백을 의미한다. df.loc[ df['분양가격'] == '', '분양가격'] = 0 # loc를 이용해 공백에 0을 넣어준다. ValueError: cannot convert float NaN to integer 값이 없음을 의미한다. df['분양가격']=df['분양가격'].fillna(0) # Nan값에 0을 넣어준다. ValueError: invalid literal for in..
-
[Python]_05_pandas_apply, lambda, map, one-hot-encoding공부/Python 2021. 6. 2. 21:04
1. apply - 함수 식이 필요함. 이때 함수 식에서는 return 사용. Q1 . 성별에 대해 남자는 1 여자는 0으로 만들어라. ※ 여기선 성별이라는 Series를 가져왔기 때문에 x를 사용하는 것 # 1. 함수 정의 def f(x) if x == '남자': return 1 elif x=='여자: return 0 # 2. appyly 적용하여 성별에 적용 df['성별']=df['성별'].apply(f) Q2. cm당 브랜드 평판지수를 구해보세요 (브랜드 평판지수/ 키) ※ 여기서는 두 개의 열 데이터가 필요하기 때문에 df라는 데이터 프레임을 가져왔다 ※ df에 대해서 apply함수를 적용할 때 axis =1을 적용해준다. ※ axis=1 :한 행 씩 처리하여 넘겨서 하나의 열로 나타내어준다. d..
-
[Python]_pandas_04_fillna,inplace,dropna,drop,drop_duplicates공부/Python 2021. 5. 31. 21:53
1. df.fillna(넣을 값) 해당 값 저장 방법 2가지 1-1. inplace= True 사용 df.fillna(넣을 값, inplace= True) inplace= True는 이 값을 저장한다는 의미. inplace=True 없으면 해당 값이 저장이 안 됨 1-2. 변수에 넣어주는 방법 df['컬럼명']=df['컬럼명'].fillna(넣을 값) 2. Dorp 2-1.NaN값에 대해 행전체 제거 df.dropna(axis =0 or 1,how='any'or'all') axis = 0: 행, =1: 열 any:행에 하나라도 NaN값이 있다면 행 전체 제거 all:모든 행이 NaN이면 행 전체 제거 2. NaN의 중복된 값을 제거 df.drop_duplicates(keep='last' or 'first..
-
[Python]_03_pandas_copy, append, max, min, count,..., gruop by, pivot, multi-index, unstack, rest_index()공부/Python 2021. 5. 28. 13:09
3# colab 사용 #강의 10 11 12 13 14 15 1. copy : 원본 데이터 유지시키고, 새로운 변수에 복사할 때 사용. - df.copy() new_df=df.copy() 2. row, column추가 - row 추가 : df.append({ '키' : '값' }, ingnore_index=True) - columns 추가 : df['국적']='대한민국' # row 추가- df.append({},ignore_index=True) # ignore_index=True을 해야 오류 안남 df=df.append({'이름':'테디','그룹':'테디그룹},ignore_index=True) # column 추가- df.['넣을 컬럼명']='넣을 값(문자)' or 넣을 값(숫자) # 문제: 이름이 지드..
-
[Python]_02_pandas_컬럼선택,loc,iloc,isin,isna,isnull,notnull,공부/Python 2021. 5. 27. 17:46
_※ colab을 사용 ※ 파일 업로드 방식은 여러 가지가 있지만 구글 드라이브를 사용함. ※ 아직 왕 초보라 틀린 부분이 있을 수도 있습니다. 혹시 발견하신다면 댓글로 알려주세요. ※ 복습용으로 간략하게 써놓은 부분입니다. 혹시 좀 더 자세히 알고 싶으신 부분이 있다면 댓글 남겨주세요. 알고 있는 내용 한에서 알려드리겠습니다.!!! # 강의 6,7,8,9 1. 컬럼 선택 방법 # 이름 컬럼에 대해 모든 행 뽑아라 (3가지 방법) df['이름'] df["이름"] df.이름 # 추천하지 않음. 2. loc / iloc - loc : 컬럼을 문자로 표현 가능 - iloc : 숫자로만 표현 가능 ### loc 이용 # 모든 데이터 뽑아라 df.loc[:] # 이름, 키 컬럼에 대한 모든 행데이터 뽑아라 df...
-
[Python]_01_pandas_구글드라이브 파일업로드,column재정의, info, describe, shape, head, tail, sort공부/Python 2021. 5. 26. 16:27
_※ colab을 사용 ※ 파일 업로드 방식은 여러 가지가 있지만 구글 드라이브를 사용함. ※ 아직 왕 초보라 틀린 부분이 있을 수도 있습니다. 혹시 발견하신다면 댓글로 알려주세요. ※ 복습용으로 간략하게 써놓은 부분입니다. 혹시 좀 더 자세히 알고 싶으신 부분이 있다면 댓글 남겨주세요. 알고 있는 내용 한에서 알려드리겠습니다.!!! 1. pandas import, 구글 드라이브로부터 csv 파일 불러오기 import pandas as pd from google.colab import drive # colab사용, 구글 드라이브 사용 drive.mount('/content/drive') filename='파일경로' df=pd.read_csv(filename) # 파일을 df 변수에 넣어줌 2. 기본정보(..