최은소 (INFRA) | 오예린 (INFRA) | 권민정 (BE) | 선우예림 (BE) | 황지민 (BE) |
---|---|---|---|---|
esc-beep | YelynnOh | mjttong | yerimsw | Jimin-Hwang00 |
- 파일을 업로드하고 링크를 통해 공유할 수 있는 기능을 구현한다.
- 업로드된 파일의 메타데이터를 처리하여 별도로 저장한다.
요구 조건
- 매일 약 100-200개의 새로운 파일 업로드 예상
- 파일 당 평균 크기는 50MB 예상
- 최대 50GB의 파일 저장 용량 필요
- 파일 업/다운로드 지연 시간은 1분 이내
심화 조건
심화 조건은 기본 요구 조건을 모두 만족한 후 생각해볼만한 추가적인 구현에 대한 내용입니다.
- 대용량 파일 전송: 최대 1GB 크기의 파일 공유 링크 생성 기능
- 접근 제어: 파일 및 폴더 단위의 세부적인 접근 권한 설정 기능
- 버전 관리: 주요 파일에 대한 최대 5개 버전 히스토리 관리
- 파일 검색: 파일명, 내용 기반 검색 기능 제공 (검색 결과 응답 시간 5초 이내)
- 전체 아키텍처 설명
- 전체 VPC에서 Public 서브넷과 Private 서브넷을 분리하여 사용자가 접근할 수 있는 부분과 DB를 저장할 수 있는 부분으로 아키텍처를 분리
- WAS 역할을 하는 EC2 인스턴스를 Public 서브넷에 배치, DB 역할을 하는 RDS 인스턴스를 Private Subnet에 배치함
- IGW
- 인터넷과 Public Subnet을 연결해주는 관문 역할을 하기 위해 배치
- ALB
- WAS의 부하를 분산 시킬 수 있는 용도로 ALB를 Public 서브넷에 배치함
- HTTP 8080 포트로 들어오는 요청에 대해 지정된 2개의 EC2 인스턴스로 트래픽 분산
- EC2
- 도커를 이용해 컨테이너화 시킨 SpringBoot 서버(WAS)를 띄우기 위한 인스턴스
- 총 2개의 인스턴스가 ALB에 연결되어 트래픽을 분산하여 담당하고 있음
- RDS
- RDS Primary - RDS Read Replica 구조 확립
- 읽기 작업이 많은 프로젝트 요구 사항을 반영하기 위해 RDS Primary 이 외에 RDS Read Replica를 추가해 읽기 작업 퍼포먼스 향상
- RDS Primary와 RDS Read Replica를 서로 다른 가용 영역에 배치
- RDS Primary - RDS Read Replica 구조 확립
- Gateway endpoint
- EC2 인스턴스와 VPC 외부에 위치한 S3를 연결하기 위해 활용
- 비용 효율성과 S3와의 호환성을 고려해 해당 서비스 선정
- S3
- 파일 원본 저장소
- EC2와 Gateway Endpoint로 연결 되어 있음
- Monitoring
- 서비스 모니터링을 위해 CloudWatch와 CloudTrail 활용
- CI/CD
- CI/CD의 경우 아래의 단계를 거쳐 진행됨
- 개발자가 GitHub 레포지토리에 코드를 푸시함
- GitHub Action이 Docker Hub에 도커 이미지를 업로드하고 S3에 프로젝트 압축 파일을 업로드함
- 이후 Code Deploy는 S3에 게시된 압축 파일을 이용해 EC2 인스턴스에 배포 진행
- 전체 아키텍처 설명
- AWS VPC (10.0.0.0/16) 내에서 Public 서브넷과 Private 서브넷을 명확히 분리하여 보안성을 강화
- WAS 역할을 하는 EC2 인스턴스를 Private 서브넷에 배치하여 직접적인 외부 접근을 차단하며, DB 역할을 하는 RDS 인스턴스 역시 Private Subnet에 배치함
- Route53
acc6-hotsix.shop
도메인 사용
- NAT
- Private 서브넷의 EC2 인스턴스들이 인터넷과 통신할 수 있도록 NAT Gateway 배치
- RDS
- 해커톤 당시 Read Replica는 성능을 위한 서비스이지 가용성을 위한 것은 아니라는 피드백을 받음
- Multi-AZ 구성으로 설정하여 RDS의 고가용성 보장
- RDS Primary - RDS Read Replica 구조를 유지하여 읽기 작업 퍼포먼스 향상
- S3
- S3 Glacier를 도입하여 장기 보관된 데이터를 비용 효율적으로 저장
- EC2
- EC2 인스턴스를 private subnet으로 이동하여 보안 강화
- Auto Scaling Group
- 트래픽 변화에 따라 EC2 인스턴스의 수를 자동으로 조절
- EC2 인스턴스는 시작 템플릿을 통해 생성됨
- AWS Session Manager
- 관리자가 EC2 인스턴스에 SSH 키 없이 안전하게 접근할 수 있음
- 네트워크 접근 제어
- Security Group을 통해 서브넷 안에서 인스턴스의 트래픽을 제어함
- NACL을 통해 서브넷에 오가는 트래픽을 제어함
- CI/CD
- 개발자가 GitHub 레포지토리에 코드를 푸시함
- GitHub Action이 Docker 이미지를 ECR에 배포
- 배포 스크립트를 S3에 업로드
- CodeDeploy를 통해 애플리케이션 자동 배포
-
github action + Docker + ECR + Codedeploy를 사용한 방식
- github action이 docker 이미지를 생성해 ECR에 업로드, codedeploy 스크립트를 생성해 S3에 업로드
- S3에 업로드한 스크립트를 codedeploy가 실행하도록 githubaction에서 트리거 전송
- codedeploy 스크립트 실행 후 배포 진행
- spring boot
- mysql
- 파일 메타데이터 저장
- 로그 저장
- SDK v1에서 v2로 버전 업
- 기존의 multipart 및 정적 S3 URL를 사용한 업로드, 다운로드를 모두 presigned URL 방식으로 변경
- CI/CD 재구축
- 예외 처리 전략 변경
기능 | 설명 | 예외처리 |
---|---|---|
파일 업로드 | - 업로드 불가능한 파일 타입: 실행 파일, 셸 스크립트, 자바 아카이브 파일 제외 - 파일 경로: '/'로 시작, 알파벳, 숫자, 밑줄만 포함 |
- 유효하지 않은 비밀번호 - 파일 중복: 같은 경로, 동일한 파일명 존재 |
파일 다운로드 | - 파일 다운로드 | - 유효하지 않은 비밀번호 - 파일 없음 |
파일 수정 | - 기존 파일과 동일한 파일 타입을 가진 파일로 수정 가능 - 수정 범위: 파일명, 파일 경로, 파일 |
- 유효하지 않은 비밀번호 - 파일 없음 - 파일 중복: 같은 경로, 동일한 파일명 존재 - 파일 타입 변화: 기존 파일과 수정 파일의 타입이 다름 |
파일 조회 (메타 데이터) |
- 조회 결과: 파일 ID, 파일 이름, 파일 생성시간, 파일 확장자, 파일 경로, 수정일자, 원본 리소스 위치 | - 유효하지 않은 비밀번호 - 파일 없음 |
파일 조회 (파일) |
- 조회 결과: 파일 미리보기 | - 유효하지 않은 비밀번호 - 파일 없음 |
파일 공유링크 생성 | - 공유 링크 생성: GET Presigned URL 생성 | - 유효하지 않은 비밀번호 - 파일 없음 |
파일 삭제 | - 파일 삭제 | - 유효하지 않은 비밀번호 - 파일 없음 |
파일 검색 | - 조회 결과: 파일 ID, 파일 이름, 파일 생성시간, 파일 확장자, 파일 경로 | - 조회 가능한 값 없음 - 검색조건 없음 |
파일 조회 (페이지) |
- 조회 결과: 파일 ID, 파일 이름, 파일 생성시간, 파일 확장자, 파일 경로 | - 조회 가능한 값 없음 - name, time 파라미터에 asc, desc 외의 다른 값 입력 |
파일 조회 (전체) |
- 조회 결과: 파일 ID, 파일 이름, 파일 생성시간, 파일 확장자, 파일 경로 - 파일 정렬: 파일 이름, 파일 생성 시간 오름차순 정렬 |
- 조회 가능한 값 없음 |
로그 조회 | - 로그 조회 | - 파일 없음 |
기능명 | URL | Http Method | body |
---|---|---|---|
파일 업로드 | /files | POST |
file, directory, password |
파일 다운로드 | /files/download/{file_id} | POST |
password |
파일 수정 | /files/{file_id} | PATCH |
file, directory, password |
파일 상세 조회(메타데이터) | /files/detail-meta/{file_id} | POST |
password |
파일 상세 조회(파일) | /files/detail-file/{file_id} | POST |
password |
파일 공유링크 | /files/share/{file_id} | POST |
password |
삭제 | /files/delete/{file_id} | POST |
password |
- presigned URL 방식으로 변경한 API
- 모두 비밀번호가 필요한 API이며, 비밀번호를 form-data로 전달
기능명 | URL | Http Method | params |
---|---|---|---|
전체 조회 | /files/all | GET |
|
조회(페이지 단위) | /files | GET |
page, name, time |
검색 | /files/search | GET |
name, path, before, after, type, page |
로그 조회 | /files/{file_id}/logs | DELETE |
type, page, size |
- 비밀번호가 필요없으며, 수정하지 않은 API
- 5명의 사용자가 동시 접속
- 각 사용자는 3분 동안 계속해서 파일 업로드를 반복 실행
- 각 반복 사이에는 1초의 휴식(
sleep(1)
)이 있음 - 파일은 .txt(1MB), .pdf(50MB), .zip(100MB)로 구성되었으며, 실제로 S3에 업로드를 진행
- 3분 동안 이루어진 45개의 요청에 대해 100% 성공
- 2명의 사용자가 동시 접속
- 각 사용자는 3분 동안 계속해서 파일 다운로드를 반복 실행
- 각 반복 사이에는 1초의 휴식(
sleep(1)
)이 있음 - 파일은 .txt(1MB), .pdf(50MB), .zip(100MB)로 구성
- 3분 동안 이루어진 37개의 요청에 대해 75.67% 성공
- 3명의 사용자가 동시 접속
- 각 사용자는 3분 동안 계속해서 파일 업로드/다운로드를 반복 실행
- 각 반복 사이에는 1초의 휴식(
sleep(1)
)이 있음 - 파일은 .txt(1MB), .pdf(50MB), .zip(100MB)로 구성
- 3분 동안 이루어진 27개의 요청에 대해 86.66% 성공
- 2명의 사용자가 동시 접속
- 각 사용자는 3분 동안 계속해서 검색 반복 실행
- 각 반복 사이에는 1초의 휴식(
sleep(1)
)이 있음 - 파일은 .txt(1MB), .pdf(50MB), .zip(100MB)로 구성
- 3분 동안 이루어진 351개의 요청에 대해 100% 성공
- 1분 동안 사용자가 10명으로 증가 → 5분 동안 사용자가 10명으로 유지 → 1분 동안 사용자가 0명으로 감소
- 각 사용자는 계속해서 메타데이터 조회 반복 실행
- 각 반복 사이에는 1초의 휴식(
sleep(1)
)이 있음 - 파일은 .txt(1MB), .pdf(50MB), .zip(100MB)로 구성
- 7분 동안 이루어진 3133개의 요청에 대해 98.65% 성공
- 1분 동안 사용자가 5명으로 증가 → 5분 동안 사용자가 5명으로 유지 → 1분 동안 사용자가 0명으로 감소
- 각 사용자는 계속해서 파일 조회 반복 실행
- 각 반복 사이에는 1초의 휴식(
sleep(1)
)이 있음 - 파일은 .txt(1MB), .pdf(50MB), .zip(100MB)로 구성
- 7분 동안 이루어진 3133개의 요청에 대해 95.45% 성공
항목 | 파일 업로드 | 파일 다운로드 | 업로드/ 다운로드 | 파일 검색 | 메타데이터 조회 | 파일 조회 |
---|---|---|---|---|---|---|
테스트 진행 시간 | 3분 | 3분 | 3분 | 3분 | 7분 | 7분 |
평균 사용자 | 5명 | 2명 | 3명 | 2명 | 10명 | 10명 |
총 발생 요청 | 45개 | 37개 | 27개 | 351개 | 3133개 | 3133개 |
성공률 | 100% | 75.67% | 86.66% | 100% | 98.65% | 95.45% |
- 매일 약 100-200개의 새로운 파일 업로드 예상
- 파일 당 평균 크기는 50MB 예상
상기된 조건을 충족시키는 것을 확인할 수 있음