■ 조건에 맞는 데이터 필터링
df.loc[조건]
- 특정 조건에 맞는 행 전체 선택
df.query(문자열_조건)
- 문자열로 표현된 조건을 입력하여 데이터프레임을 필터링
■ 특정 조건의 값 변경
df.mask(조건, 값)
- 조건이 True 인 위치의 값을 지정된 '값'으로 변경
df.where(조건, 값)
- 조건이 False 인 위치의 값을 지정된 '값'으로 변경, True 인 값은 그대로 유지
■ 조건에 따라 값 할당 (새로운 열 추가)
np.where(조건, 참일때 값, 거짓일때 값)
- 조건이 참일 때, 거짓일 때 각각 다른 값을 반환하여 새로운 열 생성
- 엑셀의 IF 문, SQL 의 IF 문 사용 방식과 유사
np.select(조건_리스트, 값_리스트)
- 여러 개의 조건을 순차적으로 확인하고, 각 조건에 맞는 값을 할당
Series.case_when([(조건1, 값1,), (조건2, 값2), ...])
- 2024년 2월에 출시된 pandas 2.2.0 버전부터 새로 추가된 기능
- 여러 개의 조건과 그에 따른 결과값을 지정하여 Series 값을 교체할 때 사용
- SQL 의 CASE WHEN 구문과 유사
'DataAnalytics > Python' 카테고리의 다른 글
| [Python] NumPy 난수 생성 함수 (0) | 2025.10.02 |
|---|---|
| [Python] PyTorch & PySpark (0) | 2025.10.01 |
| [Python] df.clip() / np.clip / torch.clamp() (0) | 2025.10.01 |
| [Python] 매직 명령어 : %%, % (0) | 2025.09.28 |