From 42765c2e863f8e4b94a87d6877d79dac4fe3ca05 Mon Sep 17 00:00:00 2001 From: Sanha Maeng Date: Tue, 19 Mar 2024 14:03:04 +0900 Subject: [PATCH 1/3] pages: update job description --- src/pages/careers.mdx | 5 +++-- 1 file changed, 3 insertions(+), 2 deletions(-) diff --git a/src/pages/careers.mdx b/src/pages/careers.mdx index 9a8f258..c5988e2 100644 --- a/src/pages/careers.mdx +++ b/src/pages/careers.mdx @@ -54,8 +54,9 @@ import figBrainRoom from './image/brain-room.png'; -- maum.ai 자체 ML/DL 알고리즘을 서비스하기 위한 API 개발 및 설계 -- ML/DL 알고리즘 기반 서비스에 대한 경량화/가속화 +- Platform-level optimization for large-scale training of Transformer-based models +- Acceleration/quantization techniques for serving generative models +- Removing redundant operations for efficient parallel decoding algorithms From 4347b9e9a97b3afb1d72956a6df8c33f24e8097b Mon Sep 17 00:00:00 2001 From: Sanha Maeng Date: Wed, 20 Mar 2024 15:34:13 +0900 Subject: [PATCH 2/3] pages: update job description --- src/pages/careers.mdx | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/src/pages/careers.mdx b/src/pages/careers.mdx index c5988e2..547a09d 100644 --- a/src/pages/careers.mdx +++ b/src/pages/careers.mdx @@ -56,7 +56,7 @@ import figBrainRoom from './image/brain-room.png'; - Platform-level optimization for large-scale training of Transformer-based models - Acceleration/quantization techniques for serving generative models -- Removing redundant operations for efficient parallel decoding algorithms +- Parallelization/caching strategies on state-of-the-art decoding algorithms From 61b05c436d1038ecf7ee585e87a1a481ab6d46fa Mon Sep 17 00:00:00 2001 From: Sanha Maeng Date: Wed, 12 Jun 2024 18:23:54 +0900 Subject: [PATCH 3/3] pages: update qualifications for MLE --- src/pages/careers.mdx | 16 ++++++++-------- 1 file changed, 8 insertions(+), 8 deletions(-) diff --git a/src/pages/careers.mdx b/src/pages/careers.mdx index 547a09d..936644b 100644 --- a/src/pages/careers.mdx +++ b/src/pages/careers.mdx @@ -54,9 +54,9 @@ import figBrainRoom from './image/brain-room.png'; -- Platform-level optimization for large-scale training of Transformer-based models -- Acceleration/quantization techniques for serving generative models -- Parallelization/caching strategies on state-of-the-art decoding algorithms +- ML/DL 모델을 효율적으로 서빙하기 위한 시스템 개발 및 설계 +- ML/DL 모델의 학습 및 서빙 성능을 높이는 최신 최적화/양자화 기법 탐색 및 적용 +- 기존 학습/서빙 시스템의 성능을 높이기 위한 개선 방안 연구 및 구현 @@ -76,9 +76,9 @@ import figBrainRoom from './image/brain-room.png'; -- TensorFlow, PyTorch 등의 프레임워크로 구현된 코드를 이해할 수 있는 분 -- gRPC와 Docker를 활용하여 GPU 자원을 사용하는 서비스 구성 경험 -- IPC, NCCL 등 프로세스 간 통신에 대한 이해 또는 네트워크 관련 지식 +- Python, C++에 능숙하여 원하는 것을 구현할 수 있는 능력 +- Docker를 사용하여 서비스를 구성할 수 있는 능력 +- PyTorch 기반의 프레임워크로 작성된 코드를 이해하고 모델 아키텍처를 파악할 수 있는 능력 @@ -99,8 +99,8 @@ import figBrainRoom from './image/brain-room.png'; - 유관 전공 석사 이상의 경력 또는 관련 학회 논문 제출 경험 -- OpenMP, MPI, CUDA 등 병렬/분산 및 GPU 프로그래밍에 대한 이해 또는 관련 지식 -- ML/DL 프레임워크를 플랫폼 수준에서 최적화하거나 관련 Repository의 Contribution 경험 +- OpenMP, MPI, CUDA 등 multi-core CPU나 가속기를 활용하여 프로그램의 성능을 최적화 해본 경험 +- ONNX, ONNX Runtime을 사용해 PyTorch 모델을 변환하고 edge device에서 실행 해본 경험