Search

안녕하세요,

데이터 과학자 윤세영입니다.

Who Am I ?

Intro

창업을 통해 데이터 분석에 대한 열정 발견

학부 3학년 때, 지도 교수님 및 학우들과 함께 주가 데이터를 이용한 거래 전략 작성 및 백테스팅을 지원하는 HTS 시스템 개발 활동에 참여했습니다. 약 1년 동안의 활동 끝에 창업을 했으며, 이후 시스템 개발과 함께 수익률 향상을 위한 거래 전략 연구 및 주가 데이터 분석 업무를 진행했습니다. 해당 업무를 수행하면서 시스템 개발보다 데이터 분석에 흥미를 느껴 해당 분야로 커리어를 시작하기로 결심했습니다.

지속적인 배움을 추구하는 데이터 과학자

창업 이후, 데이터 분석에 대하여 더 많은 배움이 필요하다는 것을 느껴 한국소프트웨어산업협회에서 주관한 6개월, 약 960시간 동안 진행된 ‘빅데이터 AI 융합 개발자 양성 과정’ 프로그램을 수료했습니다. 또한, 직장을 다니면서 데이터 사이언스 분야에 필요한 기초 지식을 쌓고 연구 논문을 작성하는 것이 필요하다고 느껴 서강대학교 정보통신대학원의 인공지능/데이터사이언스 학과에 재학 중에 있습니다.

대형 식음료 프렌차이즈 기업의 점포 개발 의사 결정 지원

전국 단위 1800개가 넘는 점포를 갖고 있는 식음료 프랜차이즈 기업 상권 기반 마케팅 플래닝 플랫폼 시스템 구축에 참여하여 점포 개발 의사 결정 지원을 위한 분석 업무를 담당했습니다. 해당 프로젝트에서 ML기반 예측 모델 개발, 점포 단위 방문 고객 지표 개발, 클라우드 기반의 모델 파이프라인 구축 및 배포 업무를 담당했습니다. 시스템 구축 후에는 해당 기업으로부터 데이터 기반의 의사 결정을 통해 매장 매출 및 시설 관리 효율성을 향상시키고, 신규 매장 입점 절차를 간소화할 수 있었다는 평가를 받았습니다.

데이터 과학자로서의 성장과 기여에 대한 포부

세상이 저에게 무엇을 주는지 기다리는 것 보다는 제가 세상에 무엇을 줄 수 있는지 고민하는 자세가 중요하다고 생각합니다. 제가 가진 경험과 기술적 역량을 바탕으로 데이터를 활용하여 주어진 문제를 함께 해결하고 비즈니스 성과를 개선해나가고 싶습니다.

Contact & Link

Email: syy258577@gmail.com

Skills

Main Sub
Search
Skills
Category
Skills
Scikit-learn
Tensorflow
AutoML (PyCaret)
Causal Impact
Survival Analysis
GCP (Google Cloud Platform)
Bigquery
MySQL
Docker
Kubeflow
VS Code
Jupyter Notebook
Notion
GitHub
Jira Confluence
Teams
Slack

Career

Junior Manager

Golden Planet (2022.06 ~ 2024.03, 1년 10개월)

담당 프로젝트
S사 상권 기반 마케팅 플래닝 플랫폼 구축 (2022.06 ~ 2024.01, 1년 8개월)
추진 배경 및 목적
급진적인 사업 성장과 그에 따른 점포 증가로 기존의 방식으로는 매장 관리 어려움
전사 및 외부 데이터를 관리하고 상권 기반의 데이터 분석이 가능한 분석 플랫폼 필요
기술 스택
Language: Python, SQL
Cloud: GCP
Data Warehouse: Bigquery
Data Preprocessing: Numpy, Pandas
Modeling: Scikit-learn, Tensorflow, Pysurvival, Causal Impact, Optuna, Pycaret
MLOps: Kubeflow, Docker, Vertex AI
담당 업무 및 성과
프로시저 생성 및 데이터 마트 구축
문제 정의: 신규점 매출 예측 시, 상권 외부 데이터를 Geo Query로 실시간 처리하는데 많은 시간이 소요됨
해결 방식: 월 단위 점포 거리 반경 및 폴리곤 단위 외부 데이터 집계 프로시저 생성 및 마트 테이블 구성
결과: 신규점 매출 예측 시간 약 83.3% 단축 (기존 약 30초 → 5초)
ML 기반 예측 모델 개발
점포 적자 예측 모델 개발
문제 정의: 각 점포 별 시설 재투자 및 폐점 대상 점포를 파악하는데 오랜 시간이 소요됨
해결 방식: 점포 개점 이후 적자 사건이 발생하기까지 걸리는 도달 시간 추정 및 적자 발생 위험 확률을 도출하기 위해 생존 분석 모델 적용
결과
생존 분석 모델 성능 지표인 c_index 약 0.79, brier_score 약 0.12 기록
적자 위험 점수 7점 이상인 점포들에 한하여 전사 평균보다 약 30% 떨어진 매출액 보임
점포 간 상호 영향도 분석
문제 정의: 반경 내 인접 점포 간 이벤트 발생(개점, 폐점, 리모델링, 확장 및 이전)에 따른 점포 간 매출 잠식 현상 발생
해결 방식: 동일 반경 내 점포 간 공통 방문 고객 수, 매출액 비중 파악 및 Causal Impact 방법론을 활용하여 이벤트 발생에 따른 매출액 인과 효과 분석
결과
이벤트 발생 이전 Causal Impact 모델의 일 평균 RMSE 약 1,347,200원 기록
개점 이벤트 발생 이후 실제 매출액 대비 이벤트 미 발생 예상 매출액 증가
폐점 이벤트 발생 이후 실제 매출액 대비 이벤트 미 발생 예상 매출액 감소
신규 점포 매출 예측 모델 개발
문제 정의: 기존의 신규 점포 입점 지역 선정 방식은 직접 입점 후보지를 방문했기 때문에 입점 의사 결정에 오랜 시간이 소요됨
해결 방식: 기존 점포 배후지 상권 분석 및 LightGBM 기반 매출 예측 모델 개발
결과: R2 약 0.874, MAPE 약 11% 기록
점포 단위 방문 고객 지표 개발
문제 정의: 점포 단위의 방문 고객 지표 미 존재
해결 방식
점포 별 충성 고객을 파악하기 위한 정기 고객 지표 개발 및 방문 주기 분석
타 지역으로부터 방문한 고객의 비율을 산출하기 위해 고객 별 주거래 지역 및 외부 방문 고객 분석
개점 1년 미만 점포들에 한하여 오픈 한 달 이내에 방문한 고객들의 방문 지속률을 파악하기 위해 Cohort Retention을 이용한 개점 월 방문 고객 잔존율 분석 수행
GCP 클라우드 기반 모델 파이프라인 구축 및 배포
문제 정의: 예측 모델 배포 파이프라인 미 존재
해결 방식
GCP Vertex-AI, Cloud Function & Scheduler를 활용한 모델 배포 및 예측 배치 작업 수행
상권 외부 데이터 집계 파이프라인에서 수급일이 일정하지 않은 외부 데이터에 대하여 일 배치 최신 적재 일자 체크 로직 도입
사내 기술 블로그
데이터 분석에서 인과관계 규명을 위한 새로운 접근, Causal Impact 분석

Staff

Data Studio (2021.07 ~ 2021.09, 3개월)

담당 프로젝트
시퀀스 레이블러 및 금융 거래 전략 시스템 개발 (2020.12 ~ 2021.09, 10개월)
(Activity에 기재된 ‘HTS 시스템 개발 및 교내 창업 활동’ 부터 시작한 프로젝트)
추진 배경 및 목적
기존 HTS 시스템에서 사용되는 높은 난이도의 거래 전략 작성 간소화
외부 데이터와 결합한 주식 거래 전략 제안
기술 스택
Crawling: FinanceDataReader, BeautifulSoup
Data Preprocessing: Numpy, Pandas
Modeling: Scikit-learn
GUI Framework: Pyside2
Visualization: Plotly
담당 업무 및 성과
주식 거래 전략 연구 및 수익률 검증
문제 정의: 기존 거래 전략 작성은 사용자 입장에서 난이도가 어려우며 가이드가 부족함
해결 방식
기술적 지표 및 거래량을 조합한 파이썬 언어 기반의 전략 조건식 생성 및 가이드 작성
거래 전략 조건식 수익률 검증 및 테스트케이스 작성
결과: 파이썬 언어 기반의 간소화된 거래 전략 조건식 제공
GUI 기반 시스템 화면 기획 및 개발
문제 정의: 사용자 입장에서 쉽게 주식 거래 데이터를 분석하고 활용할 수 있는 직관적인 인터페이스 필요
해결 방식
6개의 주요 서비스로 구성된 서비스 별 화면 기능 정의 및 설계
GUI 프레임워크 Pyside2를 이용한 GUI 화면 개발
기술적 및 레이블 지표, 거래량을 반영한 차트 시각화 UI 개발
주가 및 외부 데이터 비교 분석
문제 정의: 기존 HTS 시스템에서는 환율과 같은 외부 데이터를 접목하여 거래 수익률을 개선한 사례가 부족함
해결 방식
시가총액 상위 10개 종목에 대하여 기존 거래 전략식에 환율 데이터 반영 및 비교 분석
기존 시스템에 주가 및 외부 데이터 비교 분석 기능 추가 반영
결과: 시가총액 상위 10개 종목에 대하여 기존 대비 평균 수익률 7%p 증가

Activity

빅데이터 AI 융합 개발자 양성 과정

한국 소프트웨어 산업 협회 (2021.09 ~ 2022.03, 6개월, 960시간)

History
데이터 분석 전문 역량을 키우기 위해 해당 교육 과정 참여
교육 내용
웹 프로그래밍
Java, JSP, Spring Framework
데이터베이스
Oracle, SQL
머신러닝
Python, Data Crawling & Handling
통계 기반 머신러닝 이론
딥러닝
Keras, Tensorflow
NLP, 추천시스템

HTS 시스템 개발 및 교내 창업 활동

Data Studio (2020.07 ~ 2021.09)

History
주식 투자에 데이터 분석 기술을 접목할 수 있는 것이 흥미로워 해당 활동에 참여
지도 교수님의 자문 및 4명의 지도 학생으로 이루어진 개발 팀 프로젝트
거래 전략 작성 및 백테스팅 기술 서비스화를 위해 2021년 7월에 창업
주요 역할
경쟁사 HTS 시스템 리서치
주식 거래 전략 연구 및 수익률 검증
GUI 기반 시스템 화면 기획 및 개발
창업 유치를 위한 발표 자료 작성 및 보고
주요 프로젝트
시퀀스 레이블러 및 금융 거래 전략 시스템 개발

Paper

파이썬 언어 기반의 퀀트 전략 개발 시스템
등록 일자: 2021.06
등록 기관: 한국정보과학회
주요 내용
파이썬 언어를 이용하여 자유도 높은 거래 전략 조건식 작성 지원
기술적 지표 및 외부 데이터를 활용한 거래 전략 생성
다 종목 시뮬레이션을 이용하여 거래 전략에 적합한 종목 제시

School

기간
2023.03 ~ 재학 중
학교
서강대학교 정보통신대학원
학과
데이터사이언스/인공지능
2016.03 ~ 2022.02
한국공학대학교
(구 한국산업기술대학교)
(학점: 3.76 / 4.5)
소프트웨어공학

Awards

수상 일자
2022.03
주최 기관
한국 소프트웨어 산업 협회
수상 내역
‘빅데이터 AI 융합 개발자 양성 과정’ 최종 프로젝트 발표회 장려상

Certificate

SQL 개발자 (SQLD) (취득일: 2021.12.17)
정보처리기사 (취득일: 2021.11.26)
데이터 분석 준전문가 (ADsP) (취득일: 2019.12.24)