Cover-Letter Guide

Participant

정영섭: Professor
권도윤: Student
박명석: Student
서민지: Student

Introduce

취업을 준비하는 과정에서 가장 기본적으로 필수로 준비해야 되는 것은 바로 자기소개서 입니다. 취준생들은 자기소개서를 작성하는데 있어서 많은 어려움을 겪고 있습니다. 이에 본 프로젝트에서는 합격 자기소개서를 바탕으로 분석하여 취준생들에게 자기소개서 작성에 관한 도움을 주고자 합니다.

우리가 제공하는 기능은 다음과 같습니다.

(1) 특정 분야 및 기업에 관한 키워드

자신이 원하는 분야 및 기업에서 합격을 이루었던 중요한 단어들이 무엇인지 파악하여 자기소개서 작성 시 해당 키워드를 참고하여 반영할 수 있도록 합니다.

(2) 막힌 단어 추천 제공

자기소개서 작성 시 단어 선택에 있어서 고민이 되는 경우가 많습니다. 막힌 단어와 비슷한 단어들을 추천하여 단어 선택에 관한 고민을 해결해 줄 수 있습니다.

(3) 자기소개서 중요 문장 제공

자기소개서 안에서 중요한 문장을 제공함으로써 자신이 의도한 자기소개서 방향과 맞는지 확인할 수 있습니다.

(4) 소제목 작성 제공

실제 인사당담자들은 선호하는 자기소개서 유형으로 "소제목이 있는 자기소개서" 를 뽑았습니다.(http://news.bookdb.co.kr/bdb/IssueStory.do?_method=detail&sc.webzNo=37399&Nnews) 키워드 입력시 소제목을 작성해 주는 기능을 통해 소제목 작성에 관한 고민을 해결해주며 현재 취업 트렌드에 맞는 자기소개서를 작성할 수 있도록 도움을 줄 수 있습니다

Usage model

LDA
RNN
LSTM
GPT2

Project structure

|--Cralwer
|  |--crawler_jobkorea1.py          # jobkorea 사이트 합격 자소서 크롤링 1 
|  |--crawler_jobkorea1.py          # jobkorea 사이트 합격 자소서 크롤링 2  
  
    |--Preprocessing
    |  |--job_answer_preprocess.py     # 데이터 전처리 1
    |  |-- spec_preprocess.py    # 데이터 전처리 2

        |--jobkorea_all.csv     # 전처리 완료 데이터
        |--dataset.txt     # 소제목 데이터

        |--Hannanum
           |--hannanum_().py     # 학과 관련 분야 키워드 워드클라우드(Hannanum 사용)

        |--Komoran
           |--komoran_().py     # 학과 관련 분야 키워드 워드클라우드(Komoran 사용)

        |--Okt
           |--okt_().py      # 학과 관련 분야 키워드 워드클라우드(Okt 사용)

        |--Okt_FastText
           |--okt_FastText_model.py     # FastText 모델(Okt.morphs 사용)
           |--okt_nouns_FastText_model.py     # FastText 적용(Okt.nouns 사용)

        |--Okt_Word2Vec
           |--okt_Word2Vec_model.py    # Word2Vec 모델(Okt.morphs 사용)
           |-- okt_nouns_word2vec_model.py     # Word2Ve 적용(Okt.nouns 사용)

        |--LDA
           |--Hannanum_LDA.py     # LDA 모델(Hannanum 사용)
           |--komoran_LDA.py     # LDA 모델(Komoran 사용)
           |--okt_LDA.py     # LDA 모델(Okt 사용)

        |--TextRank
           |--Hannanum_TextRank.py     # TextRank 모델(Hannanum 사용)
           |--komoran_TextRank.py     # TextRank 모델(Komoran 사용)
           |--okt_TextRank.py     # TextRank 모델(Okt 사용)

        |--SentenceGenerator
           |--RNN_SentenceGenerator.py     # RNN을 사용한 문장 생성 모델
           |--LSTM_SentenceGenerator.py    # LSTM을 사용한 문장 생성 모델
           |--kogpt2_train_SentenceGenerator.py
           |--kogpt2_SenteceGenerator.py

How to use

crawler를 통해 데이터를 수집
Preoprocessing으로 데이터 전처리 진행
원하는 모델(LDA, LSTM 등)선택 후 py파일 실행

Requirements

- tensorflow == 1.14.0
- gensim == 3.8.3
- konlpy == 0.5.2
- wordcloud == 1.8.1
- bs4 == 4.6.0
- Python >= 3.6
- PyTorch == 1.5.0
- MXNet == 1.6.0
- onnxruntime == 1.5.2
- gluonnlp == 0.9.1
- sentencepiece >= 0.1.85
- transformers == 2.11.0

LDA 모델을 사용하기 위해서는 MALLET 패키지 다운이 필요합니다. 해당 모델을 사용할 경우 MALLET 에서 다운 받아 사용하여 주세요.
저희는 SKT-AI에서 약 20GB의 한국어 데이터를 Pre-Training 시킨 KoGPT2 모델을 사용하였습니다. 따라서 KoGPT2 사용을 위해서는 아래와 같은 작업 및 설치가 필요합니다.

Kogpt2 How to install

git clone https://github.com/SKT-AI/KoGPT2.git
pip install -r requirements.txt
pip install .

License

KOGPT2와 LDA는 modified MIT 라이선스 하에 공개되어 있습니다. 해당 모델 및 코드를 사용할 경우 모델 및 코드를 사용할 경우 라이선스 내용을 준수해주세요. 라이선스 내용은 LICENSE 파일에서 확인할 수 있습니다. (코드의 세부적인 사항은 구글링을 통해 얻어진 자료를 참고한 것입니다.)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Cover-Letter Guide

Participant

Introduce

(1) 특정 분야 및 기업에 관한 키워드

(2) 막힌 단어 추천 제공

(3) 자기소개서 중요 문장 제공

(4) 소제목 작성 제공

Usage model

Project structure

How to use

Requirements

Kogpt2 How to install

License

분석 결과

About

Releases

Packages

Contributors 3

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 448 Commits
Crawler		Crawler
Hannanum		Hannanum
Komoran		Komoran
LDA		LDA
Okt		Okt
Okt_FastText		Okt_FastText
Okt_Word2Vec		Okt_Word2Vec
Preprocessing		Preprocessing
SentenceGenerator		SentenceGenerator
TextRank		TextRank
__pycache__		__pycache__
LICENSE		LICENSE
README.md		README.md
dataset.txt		dataset.txt
jobkorea_all.csv		jobkorea_all.csv
requirements.txt		requirements.txt
권도윤, 박명석, 서민지 발표자료.pdf		권도윤, 박명석, 서민지 발표자료.pdf

License

jaaaamj0711/Coverletter-Helper

Folders and files

Latest commit

History

Repository files navigation

Cover-Letter Guide

Participant

Introduce

(1) 특정 분야 및 기업에 관한 키워드

(2) 막힌 단어 추천 제공

(3) 자기소개서 중요 문장 제공

(4) 소제목 작성 제공

Usage model

Project structure

How to use

Requirements

Kogpt2 How to install

License

분석 결과

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages