Python
-
[자료형] ListPython/Python 기초 2020. 3. 29. 21:05
여러개의 자료를 하나로 묶어 사용할 수 있는 자료형을 List라고 합니다. List형식은 대괄호([])를 사용하고 쉼표(,)를 통하여 각각의 요소를 구분합니다. List명 = [요소1, 요소2, 요소3, ··· , 요소n] ● List 사용법 변수 선언을 하고 대괄호를 사용하여 List를 만들어줍니다. list1 = [ ] or list1 = list() list2 = [1, 2, 3, 4, 5] list3 = ['a', 'b', 'c', '가', '나', '다', 'ABC'] list4 = [1, 2, 3, '가', '나', '다', False] list5 = ['a', 'b', 'c', [1, 2, 3], '가', '나', '다'] ● List의 연산 더하기 대괄호를 이용하여 만든 List를 서로 더..
-
[Data Analysis] 멕시코 풍 프랜차이즈 chipotle의 주문 데이터 분석하기(2)Python/Data Analysis 2020. 3. 22. 20:22
시각화로 분석 결과 살펴보기 tolist()와 Numpy를 활용하여 x_pos를 선언하고 0부터 50까지의 숫자를 그래프의 x축으로 사용합니다. y축에는 주문 총량에 해당하는 item_quantity.values.tolist()를 넣습니다. import numpy as np import matplotlib.pyplot as plt item_name_list = item_quantity.index.tolist() x_pos = np.arange(len(item_name_list)) order_cnt = item_quantity.values.tolist() plt.bar(x_pos, order_cnt, align= 'center') plt.ylabel('ordered_item_count') plt.title..
-
[Data Analysis] 멕시코 풍 프랜차이즈 chipotle의 주문 데이터 분석하기(1)Python/Data Analysis 2020. 3. 13. 18:08
Data Analysis 파트는 실습교재로 직접 실습하며 공부한 내용을 작성하도록 하겠습니다. 실습교재 : 이것이 데이터분석이다 with 파이썬 (윤기태 지음 / 한빛미디어) 데이터 분석은 Python의 기초와 Pandas, Numpy, Matplotlib 등의 기초적인 지식이 있어야 실습이 가능합니다. 맥시코풍 프랜차이즈 Chipotle의 주문 데이터 분석하기 우선 Pandas를 통해 예제 파일을 불러와 shape와 info를 통해 정보를 살펴봅니다. import pandas as pd file_path = './chipotle.tsv' chipo = pd.read_csv(file_path, sep = '\t') print(chipo.shape) print('-----------------------'..
-
[Data Analysis] 데이터 분석이란 무엇이며 왜 중요한가?Python/Data Analysis 2020. 3. 13. 17:32
최근 들어 4차 산업 혁명의 빅데이터가 핫해지면서 데이터 사이언티스트의 수요가 늘어나면서 많은 사람들이 데이터 분석가, 데이터 엔지니어, 데이터 사이언티스트 등에 관심을 갖기 시작했습니다. 이 중 데이터 분석이 무엇이고 왜 중요한지에 대해 알아보겠습니다. 데이터 분석이란? 데이터 분석은 유용한 정보를 발견하기 위해 분석 또는 통계 도구를 사용하여 데이터를 평가하는 프로세스입니다. 이러한 도구 중 일부는 R 또는 Python과 같은 프로그래밍 언어입니다. 이러한 도구를 사용하여 데이터를 수집하고 정렬하면 결과가 해석되어 결정을 내립니다. 최종 결과는 요약 또는 차트 또는 그래프와 같은 시각적으로 제공될 수 있습니다. 시각적 형태로 데이터를 표시하는 프로세스를 데이터 시각화라고 합니다. 데이터 시각화 도구로..
-
[Pandas] 엑셀 데이터를 이용하여 DataFrame 만들기Python/Pandas 2020. 3. 12. 01:46
Pandas의 기초를 파악했다면 이제 우리가 가장 많이 쓰는 DataFrame에 대해 좀 더 알아보도록 하겠습니다. Pandas에서는 read_csv, excel 등을 통해서 엑셀 파일이나 csv파일을 읽어 아래와 같이 DataFrame으로 만들어 낼 수 있습니다. 간단한 예제를 통해 알아보도록 하겠습니다. Excel 데이터 추출 저장되어있는 엑셀파일의 내용은 다음과 같습니다. read_excel 함수를 사용하여 불러올 엑셀파일의 경로를 적어주고 혹시 한글이 깨질것을 방지하여 엑셀파일을 불러 온 후에 encoding을 utf-8을 적용시키겠습니다. import pandas as pd df = pd.read_excel("C:/Pandas/peoples.xlsx", encoding = 'utf-8') df ..
-
[Pandas] 기초Python/Pandas 2020. 3. 10. 19:30
Pandas란? 데이터 분석(Data Analysis)을 위해 널리 사용되는 파이썬 라이브러리 패키지로 1차원 자료구조인 Series, 2차원 자료구조인 DataFrame, 3차원 자료구조인 Panel을 지원합니다. Pandas의 사용법은 다음과 같습니다. numpy와 마찬가지로 pandas도 pd라는 함축어를 사용합니다. import pandas as pd Series 1차원 자료구조로 배열 / 리스트와 같은 데이터들 받아들입니다. ● 기본 생성 data = [1,2,3,4,5] s = pd.Series(data) s ● Value 값 확인 ● 자료형 확인 ● Index 확인 ● Index 지정 - 이미 있는 데이터에 지정 ● Index 지정 - 데이터 생성하면서 지정 ● Index 활용 위에 결과 값..
-
[Numpy] 기초Python/Numpy 2020. 3. 9. 18:40
Numpy를 설치하였다면 Jupyter Notebook을 실행시킨 후 다음과 같이 사용해 볼 수 있습니다. import numpy as np 여기서 numpy를 불러오고 앞으로 우리는 이 numpy를 np라는 약자를 통해 사용할 것이기 때문에 as np (alias np)라고 적어주었습니다. 따라서 numpy를 사용할 때 번거롭게 numpy를 일일이 쳐주지 않고 np만으로도 numpy 라이브러리를 사용할 수 있습니다. 배열 생성 numpy의 기본적인 사용은 아래와 같습니다. np_arr1=np.array([1,2,3]) print(np_arr1) 다음처럼 배열안에 string이 존재한다면 자동으로 변환을 해주기도 합니다. np_arr2=np.array([1,2.0,'3']) print(np_arr2) 또..
-
Jupyter Notebook 사용방법Python/Anaconda & Jupyter Notebook 2020. 3. 6. 17:06
Jupyter Notebook은 웹 브라우저에서 파이썬 코드를 작성하고 실행해 볼 수 있는 개발도구입니다. 아나콘다를 설치한 이유이기도 한 Jupyter Notebook은 아나콘다를 통해 같이 설치되므로 별도의 설치는 필요가 없습니다. Jupyter Notebook 또한 각자의 편리한 방법에 따라 여러가지 실행법이 있지만 간단하게 2가지 정도만 소개하도록 하겠습니다. 1. Anaconda prompt를 이용한 실행 아나콘다 설치한 후 시작 화면에서 Anaconda3 폴더로 이동하면 Anaconda prompt라는 파일이 있습니다. 이 파일을 마우스 오른쪽 버튼을 클릭하여 '자세히' → '관리자 권한으로 실행' 을 누릅니다. 그다음 workspace로 사용할 디렉터리로 이동한 후에 jupyter noteb..