๐ Project ์๊ฐ | [ Youtube ] [ ์์ฐ ๋งํฌ ]
์ ํฌ ์๋ JOBits ์๋น์ค๋ IT ์ง๊ตฐ์ ๊ฐ๋ฐ์ ์ทจ์ ์ค๋น์์ ๋๊ธฐ ์ํด ํ์ํ์ต๋๋ค. ์์ ๋ฉด์ ์ง๋ฌธ ์์ฑ, ๋ชจ์๋ฉด์ ๊ธฐ๋ฅ์ ํตํด ์ค์ ๋ฉด์ ์ ๊ฐ๊น์ฐ๋ฉด์ ๋ ๊ตฌ์ฒด์ ์ธ ์ง๋ฌธ์ ์ป์ ์ ์์ต๋๋ค. ๋ํ ํผ๋๋ฐฑ๊ณผ ํจ๊ป ์ค์ ๋ฉด์ ์์ ์ข ๋ ๊ฐ์ ๋ ๋ต๋ณ์ ํ ์ ์๋๋ก ๋ฐฉํฅ์ ์ ์ํฉ๋๋ค.
์ทจ์ ์์ฅ์์์ ๊ฒฝ์๋ ฅ์ ํค์ฐ๊ธฐ ์ํด AI๋ฅผ ํ์ฉํด ๋ฉด์ ์ค๋น๋ฅผ ๋์์ฃผ๋ ์๋น์ค๋ค์ด ๋ฑ์ฅํ๊ณ ์์ง๋ง ๊ธฐ์กด ์๋น์ค๋ค์ ๋ค์๊ณผ ๊ฐ์ ๋ฌธ์ ์ ๋ค์ด ์กด์ฌํ์ต๋๋ค. ๋ฐ๋ผ์ ์ ํฌ ์๋ ์๋น์ค๋ ๋ค์๊ณผ ๊ฐ์ ๋ฐฉ์์ผ๋ก ๊ธฐ์กด ์๋น์ค๋ค์ ๋ฌธ์ ์ ์ ๋ณด์ํ์ฌ ์ค์ ๋ฉด์ ํ๊ฒฝ์ ์ฌ์ฉ์๊ฐ ์ต์ํด์ง๋ ๋ฐ์ ๋์์ด ๋๊ณ ์ํฉ๋๋ค.
๊ธฐ์กด ์๋น์ค๋ค๊ณผ์ ์ฐจ๋ณ์
์ฌ์ฉ์์ ์ด๋ ฅ์์ ์ง์ ํ์ฌ์ ์ฑ์ฉ๊ณต๊ณ
๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ์,๊ฐ์ธ ๋ง์ถคํ
์ง๋ฌธ์ ์ ์- ์ค์ ๋ฉด์ ์์ ์ถ๊ฐ ์ง๋ฌธ์ด ๋์ค๋ ํฌ์ธํธ๋ฅผ ์ด๋ฆฐ,
๊ผฌ๋ฆฌ ์ง๋ฌธ
์ ์ ๊ฐ๋ฐ์ ๊ธฐ์ ๋ฉด์
์ ๋์์ ์ฃผ๋ ํนํ๋ ์๋น์คLLM Generation
๊ณผ ์์ฒด ๋ฐ์ดํฐ์ Retriever ๋ชจ๋ธ
์ ํจ๊ป ํ์ฉํ ํ๊ฐ ์ถ์ ๋ฐฉ์
๊ฐ์ธ์ ์ฑ์ฅ๊ณผ ํ์ ์กฐํ๋ฅผ ์ถ๊ตฌํ๋ ํ, ์๋ ์๋น์ค์ ๋๋ค!
๊ฐ์ธ์ ์ฑ์ฅ == ํ์ ์ฑ์ฅ
์ด๋ผ๋ ๋ง์ธ๋๋ก ์ ๋ชจ๋ฅด๋ ๋ถ๋ถ์ด ์๋ค๋ฉด ํจ๊ป ์๋ ค์ฃผ๊ณ ๋ฐฐ์๊ฐ๋ฉด์ ์ฑ์ฅํด์์ต๋๋ค. ๋ํ ๋ฐฐ์ด ๊ฒ์ ๋ฐํ์ผ๋ก ์์ ์ ์ญ๋์ํ์์ ์กฐํ
๋กญ๊ฒ ๋ น์ฌ๋๊ฐ ์ ์๋๋ก ๋ฏฟ์ด์ฃผ๊ณ ์์ํด์ฃผ๊ณ ์์ต๋๋ค.
๊ตฌํฌ์ฐฌ | ๊น๋ฏผ์ | ์์ ๋ฆผ | ์คํ์ฐ | ์ด์์ | ์ต์์ง |
---|---|---|---|---|---|
์ด๋ฆ | ์ญํ |
---|---|
๊ตฌํฌ์ฐฌ | ๋ฐฐํฌ๋ฅผ ์ํ ํ๊ฒฝ ์ค์ (Docker-compose), Steamlit, FastAPI๋ฅผ ํตํ MongoDB CRUD, ์์ฑํ ๋ชจ๋ธ๋ก ๋ฐ์ดํฐ ์์ง ๋ฐ ๊ฒ์๋ก ๋ฐ์ดํฐ์ ๊ตฌ์ถ |
๊น๋ฏผ์ย | Back-End ๊ฐ๋ฐ, Streamlit , FastAPI ์ ํตํ ์นด์นด์ค ๋ก๊ทธ์ธ ๊ธฐ๋ฅ, ๋ฐ์ดํฐ ์ก์์ ๋ฐ ํ์ด์ง ํต์ ๊ตฌํ, Retriever ์๋ฒ ๋ฉ ๋ชจ๋ธ ํ์, ๋ฉด์ ์ง๋ฌธ ๋ฐ์ดํฐ์ ๊ตฌ์ถ ๋ฐ ๊ฒ์ |
์์ ๋ฆผย | Rule-Based ๋ชจ๋ธ ๊ตฌํ, ๋ฉด์ ์ง๋ฌธ ๋ฐ์ดํฐ์ ๊ตฌ์กฐ๋ ๊ตฌ์ถ, ๋ฐ์ดํฐ์ ์ถ๊ฐ ์์ง/์ต์ข ๊ฒ์, FastAPI๋ฅผ ํตํ MongoDB CRUD, ๋ฐฐํฌ๋ฅผ ์ํ ํ๊ฒฝ ์ค์ (Docker-compose)ย |
์คํ์ฐย | LLM , LangChain ์ ํ์ฉํ ๋ฉด์ ์ง๋ฌธ Generation ๋ชจ๋ธ ๊ตฌํ, Retriever ์ค๊ณ ๋ฐ ๊ตฌํ(FAISS, Reranker), Streamlit ์ ์ด์ฉํ Front-End ๊ฐ๋ฐ |
์ด์์ย | Streamlit ์ ์ด์ฉํ Front-End ๊ฐ๋ฐ, Retriever ๋ชจ๋ธ(DPR) ๊ตฌํ, LangChain ์ ํ์ฉํ ๋ฉด์ ์ง๋ฌธ Generation ๋ชจ๋ธ ๊ตฌํ, ๋ฉด์ ์ง๋ฌธ ๋ฐ์ดํฐ์ ๊ตฌ์ถ(LLM ๊ธฐ๋ฐ ๋ฐ์ดํฐ ์ฆ๊ฐ)ย |
์ต์์งย | Project Manager, ํ๋ก์ ํธ ๊ธฐํ ์ ์ ์งํ, Streamlit ์ ์ด์ฉํ Front-End ๊ฐ๋ฐ, LLM ํ๋กฌํํธ ์์ง๋์ด๋ง, ๋ฉด์ ์ง๋ฌธ ๋ฐ์ดํฐ์ ๊ตฌ์ถ ๋ฐ ๊ฒ์ย |
ํ๋ก์ ํธ๋ Streamlit๊ณผ FastAPI๋ฅผ ์ฌ์ฉํ์ฌ ํ๋ก ํธ์๋์ ๋ฐฑ์๋๋ฅผ ๊ตฌ์ถํ์ต๋๋ค. ์ฌ์ฉ์๋ Streamlit์ ํตํด ์ง๋ฌธ ์์ฑ ๋ฐ ๋ชจ์ ๋ฉด์ ์ ์งํํ๋ฉฐ, Kakao OAuth๋ฅผ ํตํด ๋ก๊ทธ์ธํ๊ณ MongoDB๋ฅผ ์ฌ์ฉํ์ฌ ์ฌ์ฉ์ ์ ๋ณด๋ฅผ ์ ์ฅํฉ๋๋ค. ์ด๋ฅผ ํตํด ์ฌ์ฉ์๋ ํธ๋ฆฌํ๊ฒ ์๋น์ค๋ฅผ ์ด์ฉํ ์ ์์ต๋๋ค.
์ฌ์ฉ์๊ฐ JD์ ์ด๋ ฅ์๋ฅผ ์ ๋ ฅํ๋ฉด Retrieval Model๊ณผ Generation Model ๋ ๊ฐ์ง๋ก ๋ค์ด๊ฐ๊ฒ ๋ฉ๋๋ค. Generation ๋ชจ๋ธ์์๋ ํ๋ก์ ํธ์ ๊ด๋ จ๋ ์ง๋ฌธ์ ์์ฑํ๋ฉฐ, Retrieval ๋ชจ๋ธ์ Rule-based ๋ชจ๋ธ๊ณผ Semantic Search๋ก ๊ตฌ์ฑ๋์ด ๊ธฐ์ด ๊ธฐ์ ๋ฉด์ ์ง๋ฌธ์ ์์ฑํฉ๋๋ค. ์ด๋ฅผ ํตํด ์์ ๋ฉด์ ์ง๋ฌธ N๊ฐ๊ฐ ์ ์ ๋๋ฉฐ, ๋ชจ์๋ฉด์ ์๋น์ค์ ๋ฉด์ ์์ ์ง๋ฌธ ์์ฑ ์๋น์ค 2๊ฐ์ง๋ก ์๋น์ค๊ฐ ์ ๊ณต๋ฉ๋๋ค.
1๏ธโฃ Retriever Model
์ง์ ๊ตฌ์ถํ ์ค์ ๊ธฐ์ ๋ฉด์ ๋ฐ์ดํฐ์ ์ ๋ฐํ์ผ๋ก ๊ธฐ์ ๋ฉด์ ์ง๋ฌธ์ ์ถ์ถ
-
- [FAISS] ๊ธฐ์ ๋ฉด์ ์ง๋ฌธ ๋ฐ์ดํฐ์ ์ค JD์ ๊ด๋ จ์ฑ ๋์ ํ๋ณด๊ตฐ n*k๊ฐ ์ง๋ฌธ ๊ฒ์
- [๏ปฟReranker] ๊ฒ์๋ ๋ฉด์ ์ง๋ฌธ๋ค ํ๋ณด๊ตฐ์ ๋ํด reranking๋ฅผ ํตํด JD ์ ์ฒด์์ ๊ด๋ จ๋ ์๋ k๊ฐ์ ์ง๋ฌธ ์ถ์ถ
-
- ์ฑ์ฉ ๊ณต๊ณ ๋ฐ ์ด๋ ฅ์์ ํน์ ํค์๋๊ฐ ๋ฑ์ฅํ ๊ฒฝ์ฐ, ํด๋น ํค์๋์ ๊ด๋ จ๋ ์ง๋ฌธ์ ์ถ์ถ
- ์ฐ๊ด์ฑ์ ๋์ด๊ธฐ ์ํด ๋ค์ํ ๊ท์น ์ถ๊ฐ
- 900๊ฐ ์ด์์ ๋ฉด์ ์ง๋ฌธ ๋ฐ์ดํฐ์ ์ ์ง์ ์คํฌ๋ฉํ ํ ๊ฒ์ํ์ฌ ๋ฐ์ดํฐ์ ์ ๊ตฌ์ถ, ์ง๊ตฐ์ ๊ฒฝ์ฐ AI, ๋ฐฑ์๋, ํ๋ก ํธ์๋, CS ์ง์ ๊ด๋ จ ์ง๋ฌธ์ผ๋ก ๋ถ๋ฅํ์ฌ ๋ฐ์ดํฐ๋ฅผ ์์ง
- ๋ํ, IT Tech ์ง๊ตฐ์ ์ฑ์ฉ ๊ณต๊ณ ๋ฅผ ํฌ๋กค๋งํ์ฌ ์ป์ ๋ฐ์ดํฐ์์, ์ง๋ฌด์ ๊ด๋ จ๋ ์ฃผ์ ํค์๋๋ฅผ ์ถ์ถํ์ฌ, ํค์๋์ ๋ฉด์ ์ง๋ฌธ ๋ฐ์ดํฐ์ ์ ๋งค์นญ์์ผ ๋ฃฐ๋ฒ ์ด์ค๋ ์๊ณ ๋ฆฌ์ฆ๊ณผ Retriever์ ํ์ฉ
2๏ธโฃ Generation Model
- ํ๋ก์ ํธ ๊ด๋ จ ์ง๋ฌธ ์์ฑ, ๊ผฌ๋ฆฌ์ง๋ฌธ, ํผ๋๋ฐฑ , ํํธ ์ ๊ณต
- OpenAI์ ChatGPT APIํ์ฉ
- Langchain์ ์ด์ฉํ์ฌ ์ํคํ ์ณ ๊ตฌ์ถ
- Prompt Engineering ํ์ฉ
โ ย ์์ ๋ฉด์ ์ง๋ฌธ ์์ฑ
3๋จ๊ณ์ ์ฒด์ธ์ ํตํด ๋ฉด์ ์ง๋ฌธ์ด ์์ฑ๋ฉ๋๋ค. Chain1,2์์๋ Job Description๊ณผ ์ด๋ ฅ์์์ ์ฃผ์ ๋ด์ฉ์ ์ถ์ถํด์ค๋ฉฐ, ์ด๋ฅผ ํ์ฉํด ์์ ๋ฉด์ ์ง๋ฌธ์ ์์ฑํ๋ Chain3๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
โ ย ๋ชจ์๋ฉด์ ์๋น์ค
Langchain์ memory ๊ธฐ๋ฅ์ ํ์ฉํด ์ด์ ๋์ง๋ฌธ๊ณผ ๋ฉด์ ์์ ๋ต๋ณ์ ๊ธฐ์ตํ์ฌ ๊ผฌ๋ฆฌ์ง๋ฌธ์ ์์ฑํฉ๋๋ค.
โ ย ์์ ๋ฉด์ ์ง๋ฌธ ์์ฑ-ํผ๋๋ฐฑ ์๋น์ค
- ์์ฑํ ๋ชจ๋ธ ํน์ฑ ์ ์ ๋์ ์งํ ์ฌ์ฉ์ด ์ด๋ ค์, ํด๋จผ ํผ๋๋ฐฑ ๊ธฐ๋ฒ์ ์ฌ์ฉํ์ฌ ์์ฑ๋ ์์ ์ง๋ฌธ์ ๋ํ ํ๊ฐ๋ฅผ ํตํด ๋ชจ๋ธ ํ๊ฐ๋ฅผ ์งํํ์์ต๋๋ค.
- ์ ์ฌ ์๋น์ค 3๊ฐ์ ์ ํฌ ํ๋ก์ ํธ์ ์์ ๋ฉด์ ์ง๋ฌธ์ ๋ธ๋ผ์ธ๋๋ก ์ฌ์ฉ์์๊ฒ ์ ๊ณตํ ๋ค, ์๋น์ค์์ ์ค์ํ๋ค๊ณ ์๊ฐ๋๋ ๋ค์ ์งํ(metric)์ ๋ํ์ฌ ํ๊ฐ๋ฅผ ์์ฒญํ์์ต๋๋ค.
- ๊ทธ ๊ฒฐ๊ณผ, ์ ๋ฐ์ ์ธ ํ๊ฐ์์ ์ ํฌ ์๋ ์๋น์ค ํ์ ์์ฑ ๊ฒฐ๊ณผ๊ฐ ๊ฐ์ฅ ์ข์ ํ๊ฐ๋ฅผ ๋ฐ์ ์ ์ ํ์ธํ ์ ์์์ต๋๋ค.