꾸준히 성장하기

[D+13] 교육 | 판다스(Pandas) 데이터프레임으로 데이터 조회하기 본문

KT 에이블스쿨 5기/교육

[D+13] 교육 | 판다스(Pandas) 데이터프레임으로 데이터 조회하기

data.dohii 2024. 3. 4. 22:58

오늘의 학습 일지는 판다스(Pandas) 라이브러리를 사용한 데이터프레임의 조회에 관한 내용입니다. 

어제는 데이터프레임의 생성과 기본적인 탐색 방법에 대해 알아보았습니다.  오늘은 좀 더 발전된 조회 기법을 다뤄보려 합니다.


1. 준비 단계: 라이브러리 및 데이터 로드

먼저, 판다스와 기타 필요한 라이브러리를 불러오고, 분석할 데이터를 로드하는 과정부터 시작합니다.

.head()를 통해서 우리가 작업하려는 데이터가 어떻게 생겼는지 미리 보면 더 좋습니다.

 

2. 데이터프레임 조회하기

2-1. 특정 열 조회
특정 열만 선택하여 조회하려면, 열 이름을 리스트 형태로 지정합니다. tip.loc[ 행, 열 ] 형태인 걸 기억해주세요.

 

2-2. 열 범위 조회
열의 범위를 지정하여 조회할 때는 .loc[] 메서드를 사용합니다.

이때, 마지막 열 이름도 조회 범위에 포함됩니다.

열 이름으로 가져오는 것은 [] 쓰지 말고 마지막 이름까지 가져옴 -1의 개념이 아닙니다.

 

2-3. 단일 조건으로 조회
특정 조건을 만족하는 행만 조회하고 싶을 때는 다음과 같이 조건식을 사용합니다.

 

2-4. 다중 조건으로 조회
여러 조건을 조합하여 조회할 때는 조건식을 괄호로 묶고, & (AND) 또는 | (OR) 연산자를 사용합니다.

 

2-5. .isin([값1, 값2, ... , 값n]) 메서드 사용하기

여러 값을 포함하는 행을 조회할 때 .isin() 메서드를 사용하면 편리합니다.

 

2-6. .between(값1, 값2) 메서드 사용하기

특정 범위 안의 값을 가진 행을 조회하려면 .between() 메서드를 사용합니다.

between(값1, 값2): 값1 ~ 값2까지 범위안의 데이터만 조회합니다.

 


오늘은 판다스를 사용하여 데이터를 다양한 방식으로 조회하는 방법을 살펴보았습니다.

이러한 기법들은 데이터 분석 과정에서 매우 유용하게 사용될 수 있습니다.

데이터를 효과적으로 다루기 위한 첫걸음을 뗀 것 같아 기쁩니다.

내일은 데이터 집계와 관련된 더 깊이 있는 내용을 탐구할 예정입니다.

반응형