Skip to content

Latest commit

 

History

History
119 lines (55 loc) · 4.1 KB

README_ko.md

File metadata and controls

119 lines (55 loc) · 4.1 KB

2020-1 YBIGTA CONFERENCE

XAI : explainable AI

사이트 주소

http://hamacojr.asuscomm.com/

실행방법

  1. docker를 설치한다

  2. docker build -t xai:latest . 을 실행한다

  3. docker run --name xai -d -p 80:80 xai:latest 을 실행한다


  1. What is XAI?

    설명 가능한 인공지능 - 머신러닝 모델의 동작 과정 내부의 블랙박스로 인한 복잡성을 해소하기 위한 시도

  2. Why XAI?

    인공지능의 학습 과정을 이해함으로써 얻을 수 있는 인사이트와 신뢰를 통해 인공지능을 통한 의사결정 과정 개선

  3. Methods in XAI

    • PDP Partial Dependence Plots

      모델의 학습 편향을 예측해서 모델의 각 피쳐와 예측 결과 간의 선형 관계를 시각화

      이를 통해 해당 피처와 예측 결과 간의 상관관계를 이해할 수 있음

    • LIME Local Interpretable Model-agnostic Explanations

      데이터의 어떤 영역을 집중해서 분석했고 어떤 영역을 분류 근거로 사용했는지 알려주는 기법

      입력 데이터에 부분적으로 변화를 주어서 텍스트/이미지의 하이라이트를 찾는 기법

    • SHAP SHapley Additive exPlanations

      기존의 피쳐 중요도 계산법은 피쳐 간의 독립성을 가정하고 있는 반면, 피쳐 간의 의존성을 고려하여 피쳐 중요도를 계산하고 그 결과를 시각화하는 기법

    • Filter Visualization

      CNN 모델의 forward pass를 시각화함으로써 데이터가 각 레이어와 필터를 통과하며 어떻게 변형되는지 직관적으로 확인할 수 있음

      레이어를 지남에 따라 픽셀이 성기고 해상도가 떨어지는 경향이 있으며, 한 레이어 내에서도 필터에 따라 데이터를 인식하는 영역과 정도가 다름. 이렇게 확인한 특성을 모델 개선에 활용할 수 있음.

    • LRP Layer-wise Relevance Propagation

      Relevance란 각 feature(pixel) 값이 최종 아웃풋에 기여하는 정도를 뜻한다. LRP는 딥러닝 모델을 backpropagation을 통해 역추적하여 각 레이어의 relevance값을 구하다 보면, 첫 인풋 레이어에 도달하고, 이때 각 feature(pixel)의 기여도를 구할 수 있다.

  4. Datasets and Models

    • Machine Learning
      • XGBoost

        Boston Housing Dataset (keras) : 미국 보스턴 지역의 지역별 지표와 해당 구역의 주택 가격의 중간값

    • Deep Learning
      • CNN

        MNIST Dataset (keras) : 28*28 픽셀의 크기의 손글씨로 쓴 0부터 9까지의 숫자와 실제 값

      • LSTM

        IMDB Dataset (keras) : IMDB 사이트에서 가져온 영화 리뷰(문장)와 리뷰의 감정(긍정/부정) 라벨

  5. 웹사이트 사용법

    • Vision / NLP / Machine Learning 선택
      • Vision

        • 분석할 숫자 그리기
        • SHAP / LRP / LIME / Filter Visualization 중 선택
          • SHAP: 예측에 영향을 미치는 피처 중요도를 수치화&시각화
          • LRP: 예측 결과와 예측에 중요한 역할을 한 픽셀들의 히트맵
          • LIME: 인풋 이미지에서 중요도가 높은 부분 하이라이트/마스킹 한 결과
          • Filter Visualization: Layer 0/1/2/3 선택, 각 레이어를 통과한 이후의 데이터의 픽셀 값 결과 확인 가능
      • NLP

        • 분석할 텍스트 입력
        • SHAP / LIME 중 선택
          • SHAP: 예측에 영향을 미치는 피처 중요도를 수치화&시각화
          • LIME: 긍정/부정 예측 결과와 예측에 중요한 역할을 한 단어들 하이라이트한 입력 텍스트 출력
      • Machine Learning

        • PDP 선택
          • 12개의 변수 중 중요도를 확인할 변수 선택 후 결과 그래프 확인

강소영 (엔지니어링 15기) 백진우 (사이언스 15기) 김주은 (사이언스 16기) 정정호 (사이언스 16기) 조석주 (사이언스 16기)