분류 평가 지표

2024. 3. 18. 13:39· ai
목차
  1. 분류 평가 지표
  2. f1- score
  3. AUC ( ROC Curve)

 

분류 평가 지표

                                                    모델의 예측 ⇒ 1                                                예측 ⇒ 0

실제 상태 ⇒ 1 TP( [ 1, 1 ] ) = TRUE FN( [ 1, 0] ) =FALSE
실제 상태 ⇒ 0 FP( [ 0, 1 ] ) = FALSE TN( [ 0, 1] ) = TRUE

위 그림의 ‘정확도’가 일반적으로 생각하는 모델의 성능을 평가하는 방식이다.하고

전체 예측 중 성공 비율을 보여준다.

허나 다른 평가 방식으로 Precision, Recall이 있다.

 

precision

모델의 예측 결과를 Positive, Negative로 나누었을 때 전체 Positive 중 정답 비율을 precision이라고 한다

 

Recall

모델이 Positive라고 예측해야 이상적인 전체 타겟 중 모델이 정확하게 Positive라고 맞춘 비율

 

 

두 평가 기준의 공통점은 TP( [1,1] =True) 값이 높을 수록 점수가 오른다는 것이다.

또한 차이점은 precision은 모델의 Positive의 기준으로 예측 성공률에 집중(TP+FP ), Recall은 모델의 예측을 통한 타겟의 도출율에 집중(TP+ FN)한다.

 

만약 환자의 암 진단 모델이 있다고 가정한다.(여기서 어떤 평가 방식 더 옳은지는 배제)

그렇다면 환자 중 실제 암에 걸려있는 상태를 1, 아닌 건강한 상태를 0이라고

실제 암에 걸린 상태를 타겟으로 지정한다.

그렇다면 여기서

precision은 모델이 1이라고 예측한 값 중 성공률을 뜻하고

recall은 전체 암 환자 중(모델이 1이라고 예측해야 이상적인) 모델의 예측 값이 1인 비율을 뜻한다.

 

 

FN가 중요한 분야는 precision

FP가 중요한 분야는 recall

 

f1- score

둘 다 고려한 경우 f1- score

f1-score = 2 * ( (precision * recall) / (precision + recall)) 

f1-score의 경우 precision과 recall의 조화평균 값으로 (두 점수의 차이량, 두 점수의 절대값)이 점수를 결정한다.

 

 

AUC ( ROC Curve)

Roc curve - 이진 분류기를 성능을 판단하는 방법

 

(암에 걸렸는 확인하는 모델을 예시)

Ture Positive Rate : 실제 암환자 중 Positive 라고 판단한 비율

False Positive Rate : 실제 암에 걸리지 않은 환자 중 Positive 라고 판단한 비율

 

threshold : 좌측 그림의 수직선을 말함

(Roc curve가 좌상단에 붙을 수록)

그래프의 휨 정도를 구별하는 것(그래프의 하단 부분의 면적이 넓다)는 것은 그만큼 이진 분류를 잘해나가고 있다는 것이다.

 

 

참고 영상

https://www.youtube.com/watch?v=xtpffUWlvGk

 

https://www.youtube.com/watch?v=n7EoYT5kDO4

 

'ai' 카테고리의 다른 글

미로 찾기 강화학습 과제 후기(3가지 열쇠, 3가지의 문 그리고 Q learning을 곁들인)  (1) 2024.11.10
qwk metrics  (0) 2024.05.09
optimizer & adam  (0) 2024.05.08
  1. 분류 평가 지표
  2. f1- score
  3. AUC ( ROC Curve)
'ai' 카테고리의 다른 글
  • 미로 찾기 강화학습 과제 후기(3가지 열쇠, 3가지의 문 그리고 Q learning을 곁들인)
  • qwk metrics
  • optimizer & adam
comoZ
comoZ
인공지능 개발자 지망생입니다!
comoZ/이호준 - 일지인공지능 개발자 지망생입니다!
comoZ
comoZ/이호준 - 일지
comoZ
전체
오늘
어제
  • 분류 전체보기 (78)
    • 일지 (15)
    • Algorithm (5)
      • 자료구조와 알고리즘 (2)
      • 백준 (2)
      • 이것이 코딩테스트다 with 파이썬 (1)
    • Development studies (25)
      • java (2)
      • spring (9)
      • python (1)
      • 군장병 sw개발 (6)
      • kaggle (2)
    • ai (5)
      • 혼자 공부하는 머신러닝+딥러닝 (1)
    • 수학 (0)
      • 선형대수학 (0)
      • 집합론 (0)
    • CS (0)
      • computer architecture (0)
    • Toy Projects (2)
    • 자격증 (4)
    • Reviews (18)
    • Others (3)
    • 네이버 부스트 캠프 - AI (1)

블로그 메뉴

  • 홈
  • 태그
  • 방명록

공지사항

  • 2024 공지!
  • 으아
  • 대체불가 인공지능 개발자를 목표로 하는 이호준입니다.

인기 글

태그

  • 그래프 탐색
  • dfs
  • Q learning
  • 초급1
  • Groom
  • qu
  • sw역량강화
  • 미로 찾기 강화학습
  • 삼항연산자
  • 스택
  • 다운캐스팅
  • stackoverflow
  • Stack
  • 코드트리조별과제
  • 코딩테스트
  • final
  • kakaoenterprise
  • 큐
  • reinforcement learning
  • openpyxl
  • queue
  • BFS
  • Tkinter
  • ai역량강화
  • downcasting
  • 군 장병 맞춤
  • 코드트리
  • Pyinstaller
  • sw개발

최근 댓글

최근 글

hELLO · Designed By 정상우.v4.2.2
comoZ
분류 평가 지표
상단으로

티스토리툴바

개인정보

  • 티스토리 홈
  • 포럼
  • 로그인

단축키

내 블로그

내 블로그 - 관리자 홈 전환
Q
Q
새 글 쓰기
W
W

블로그 게시글

글 수정 (권한 있는 경우)
E
E
댓글 영역으로 이동
C
C

모든 영역

이 페이지의 URL 복사
S
S
맨 위로 이동
T
T
티스토리 홈 이동
H
H
단축키 안내
Shift + /
⇧ + /

* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.