Jerry의 컴퓨터 일기

  • 홈
  • 태그
  • 방명록

2023/10/21 1

데이터 분석 이상치 처리 (Z-score,IQR)

이상치 처리 방법 제거 : 이상치를 제거하는 방법이다. 간단하지만 유효한 데이터일 경우 손실이 발생. 대체 : 이상치를 대체하는 방법이다. 평균, 중앙값, 최빈값 등으로 대체하여 사용. 범주화 : 연속형 변수를 구간별로 나누고 이상치를 특정 구간에 할당. 변환 : 이상치를 왜곡시키거나 조정한다. ex ) 로그 변환 이 포스터에 제거 방법에 대해 다룰 예정이다. 이상치 제거에는 여러 방법이 있는데 사분위수 방법과 Z-score 방법에 대해 알아보자. 1. 사분위수 방법 먼저 데이터를 오름차순으로 정렬한다. 그리고 25%,75%(Q1,Q3)에 해당하는 위치 값을 구한다. 그러면 IQR (IQR = Q3-Q1)의 값을 구할 수 있는데 여기에 가중치를 곱한 후 범위에 벗어나는 값을 이상치로 처리한다. 즉 , d..

ℹ️ 데이터/데이터 분석 2023.10.21
이전
1
다음
더보기
프로필사진

Jerry의 컴퓨터 일기

기억보다는, 기록을 남깁니다.

  • 분류 전체보기 (288)
    • 🖥️ 컴퓨터 기초 (20)
      • PintOS (15)
      • CS (5)
    • ♟️ 알고리즘 (146)
      • swea (41)
      • 알고리즘_프로그래머스 (12)
      • 알고리즘_백준 (75)
      • Leetcode (17)
      • 기본 개념 (1)
    • ⚙️ Backend (22)
      • Network (10)
      • API (4)
      • DB (6)
      • Docker (0)
    • 🏠 Frontend (3)
    • 📚 Git (8)
    • 🤖 Chat GPT (2)
    • ℹ️ 데이터 (11)
      • 데이터 분석 (6)
      • 크롤링 (5)
    • 🔖Java (5)
      • 프로젝트 (0)
    • 🔖Python (5)
      • Folium (1)
      • Opencv (1)
      • 기타 (2)
    • 🔖JS (4)
    • 🔖 C언어 (1)
    • 🔧 컴퓨터 에러 (5)
    • 😀 Jerry (56)
      • 채용설명회 (3)
      • 마인드셋 (0)
      • 일상 (13)
      • 면접 질문 (40)

Calendar

«   2023/10   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

  • 깃허브

티스토리툴바