꾸준히 성장하기

[D+12] 교육 | 판다스(Pandas) 데이터 프레임 생성 및 탐색 본문

KT 에이블스쿨 5기/교육

[D+12] 교육 | 판다스(Pandas) 데이터 프레임 생성 및 탐색

data.dohii 2024. 3. 3. 23:19

오늘은 데이터 분석의 핵심 도구 중 하나인 판다스 라이브러리에 대해 탐구해보았습니다.

데이터프레임은 판다스를 사용하는 주된 이유이자, 데이터를 처리하고 분석하는 가장 효율적인 수단입니다. 


1. 데이터 프레임이란?

데이터프레임은 표 형식의 데이터를 담는 판다스의 핵심 구조입니다. 이를 통해 데이터를 쉽게 조회, 처리 및 분석할 수 있죠.

 

2. 데이터 프레임 생성하기

라이브러리 불러오기
먼저, 판다스와 넘파이 라이브러리를 불러옵니다. 이 두 라이브러리는 데이터 분석에 있어서 손꼽히는 조합이죠.

 

리스트로 데이터 프레임 만들기
2차원 리스트를 활용해 간단한 주식 가격 데이터프레임을 만들어봅시다.

 

딕셔너리로 데이터 프레임 만들기
이번에는 딕셔너리를 사용해 인물 정보를 담은 데이터프레임을 생성해보겠습니다.

 

3. CSV 파일 읽어오기

CSV 파일에서 데이터를 읽어오는 것은 데이터 분석의 시작점이 될 수 있습니다.

 

4. 인덱스 재정립하기

데이터프레임의 인덱스를 조정하여 데이터를 더욱 명확하게 탐색할 수 있습니다.

첫번째 열이 연도로 설정되어있을 때, 0부터 시작하는 순번을 매기고 싶으면 아래 코드 순서대로 실행해주면 됩니다.

우선 첫번째 열의 인덱스 이름을 삭제해줍니다. 다음은 인덱스를 초기화해주고(0부터의 순번이 생성됨.) 연도의 열 이름이 index로 되어있으므로 열 이름을 변경해줍니다.

 

5. 데이터 프레임 탐색 기본

데이터프레임을 탐색하는 기본적인 방법들을 알아봅시다.

기본적으로 .head()를 작성할 경우는 위의 5가지를 보여줍니다.

 

6. 고유값 확인하는 법

데이터의 다양성을 파악하는 데 유용한 고유값 확인 방법입니다.

앞으로 자주 사용하게 될 메서드는 .value_counts()이므로 머리 속에 저장!

 

7. 간단한 연산

데이터프레임에 대한 기본적인 수치 연산을 수행해봅시다.

axis=0은 '행'의 방향이고 axis=1은 '열'의 방향이므로 합계로 접근했을 때는 아래 코드와 같다.

 


오늘 배운 판다스의 기능들은 데이터 분석의 입문 단계에서 매우 중요합니다. 

각 기능을 활용하여 실제 데이터에 적용해보면서 더 깊은 이해를 할 수 있었습니다.

다음 강의도 너무 기대가 됩니다😉

반응형