2020-1 YBIGTA CONFERENCE
-
docker를 설치한다
-
docker build -t xai:latest .
을 실행한다 -
docker run --name xai -d -p 80:80 xai:latest
을 실행한다
-
설명 가능한 인공지능 - 머신러닝 모델의 동작 과정 내부의 블랙박스로 인한 복잡성을 해소하기 위한 시도
-
인공지능의 학습 과정을 이해함으로써 얻을 수 있는 인사이트와 신뢰를 통해 인공지능을 통한 의사결정 과정 개선
-
-
모델의 학습 편향을 예측해서 모델의 각 피쳐와 예측 결과 간의 선형 관계를 시각화
이를 통해 해당 피처와 예측 결과 간의 상관관계를 이해할 수 있음
-
데이터의 어떤 영역을 집중해서 분석했고 어떤 영역을 분류 근거로 사용했는지 알려주는 기법
입력 데이터에 부분적으로 변화를 주어서 텍스트/이미지의 하이라이트를 찾는 기법
-
기존의 피쳐 중요도 계산법은 피쳐 간의 독립성을 가정하고 있는 반면, 피쳐 간의 의존성을 고려하여 피쳐 중요도를 계산하고 그 결과를 시각화하는 기법
-
CNN 모델의 forward pass를 시각화함으로써 데이터가 각 레이어와 필터를 통과하며 어떻게 변형되는지 직관적으로 확인할 수 있음
레이어를 지남에 따라 픽셀이 성기고 해상도가 떨어지는 경향이 있으며, 한 레이어 내에서도 필터에 따라 데이터를 인식하는 영역과 정도가 다름. 이렇게 확인한 특성을 모델 개선에 활용할 수 있음.
-
Relevance란 각 feature(pixel) 값이 최종 아웃풋에 기여하는 정도를 뜻한다. LRP는 딥러닝 모델을 backpropagation을 통해 역추적하여 각 레이어의 relevance값을 구하다 보면, 첫 인풋 레이어에 도달하고, 이때 각 feature(pixel)의 기여도를 구할 수 있다.
-
-
-
-
XGBoost
Boston Housing Dataset (keras) : 미국 보스턴 지역의 지역별 지표와 해당 구역의 주택 가격의 중간값
-
-
-
CNN
MNIST Dataset (keras) : 28*28 픽셀의 크기의 손글씨로 쓴 0부터 9까지의 숫자와 실제 값
-
LSTM
IMDB Dataset (keras) : IMDB 사이트에서 가져온 영화 리뷰(문장)와 리뷰의 감정(긍정/부정) 라벨
-
-
-
-
-
Vision
- 분석할 숫자 그리기
- SHAP / LRP / LIME / Filter Visualization 중 선택
- SHAP: 예측에 영향을 미치는 피처 중요도를 수치화&시각화
- LRP: 예측 결과와 예측에 중요한 역할을 한 픽셀들의 히트맵
- LIME: 인풋 이미지에서 중요도가 높은 부분 하이라이트/마스킹 한 결과
- Filter Visualization: Layer 0/1/2/3 선택, 각 레이어를 통과한 이후의 데이터의 픽셀 값 결과 확인 가능
-
NLP
- 분석할 텍스트 입력
- SHAP / LIME 중 선택
- SHAP: 예측에 영향을 미치는 피처 중요도를 수치화&시각화
- LIME: 긍정/부정 예측 결과와 예측에 중요한 역할을 한 단어들 하이라이트한 입력 텍스트 출력
-
Machine Learning
- PDP 선택
- 12개의 변수 중 중요도를 확인할 변수 선택 후 결과 그래프 확인
- PDP 선택
-
-
강소영 (엔지니어링 15기) 백진우 (사이언스 15기) 김주은 (사이언스 16기) 정정호 (사이언스 16기) 조석주 (사이언스 16기)