research notes

Interpretability and Explainablity 차이 본문

인공지능 신뢰성/eXplainable AI(XAI)

Interpretability and Explainablity 차이

forest62590 2022. 1. 28. 17:56
728x90
  • 해석가능성(Interpretability)은 모델의 입력 또는 알고리즘 매개변수의 변화 등에 따라 예측이 어떻게 변화하는지 확인 가능하게 하는 기능적 요소를 의미한다.
  • 해석가능성은 인공지능 시스템을 구축하는 전문가에 의해 대부분 활용되며 설명가능성의 기본이 된다.
  • 해석가능성 (Interpretability)의 범위는 인공지능 시스템에서 발생하는 결과의 원인을 이해하는 것이다.

 

  • 반면에 설명가능성은 해석가능성을 뛰어넘어 인간-컴퓨터 상호 작용(HCI), 법률 및 윤리와 같은 다른 분야와의 결합을 통해 더 다양한 사용자들이 이해 할 수 있는(Understandable) 형태로 모델이 어떻게, 왜 예측을 내놓았는지 이해할 수 있게 도와준다.
  • 설명가능성 (eXplainability)의 범위는 단순히 인공지능 기술 뿐만 아니라 인간-컴퓨터 상호작용(HCI) 및 사회과학(Social Science) 분야를 포함한다.

References:

[1] Interpretable AI, Ajay Thampi, Manning Publications

728x90
Comments