데이터 과학자 윤세영입니다.
Who Am I ?
Intro
창업을 통해 데이터 분석에 대한 열정 발견
학부 3학년 때, 지도 교수님 및 학우들과 함께 주가 데이터를 이용한 거래 전략 작성 및 백테스팅을 지원하는 HTS 시스템 개발 활동에 참여했습니다. 약 1년 동안의 활동 끝에 창업을 했으며, 이후 시스템 개발과 함께 수익률 향상을 위한 거래 전략 연구 및 주가 데이터 분석 업무를 진행했습니다. 해당 업무를 수행하면서 시스템 개발보다 데이터 분석에 흥미를 느껴 해당 분야로 커리어를 시작하기로 결심했습니다.
지속적인 배움을 추구하는 데이터 과학자
창업 이후, 데이터 분석에 대하여 더 많은 배움이 필요하다는 것을 느껴 한국소프트웨어산업협회에서 주관한 6개월, 약 960시간 동안 진행된 ‘빅데이터 AI 융합 개발자 양성 과정’ 프로그램을 수료했습니다. 또한, 직장을 다니면서 데이터 사이언스 분야에 필요한 기초 지식을 쌓고 연구 논문을 작성하는 것이 필요하다고 느껴 서강대학교 정보통신대학원의 인공지능/데이터사이언스 학과에 재학 중에 있습니다.
대형 식음료 프렌차이즈 기업의 점포 개발 의사 결정 지원
전국 단위 1800개가 넘는 점포를 갖고 있는 식음료 프랜차이즈 기업의 상권 기반 마케팅 플래닝 플랫폼 시스템 구축에 참여하여 점포 개발 의사 결정 지원을 위한 분석 업무를 담당했습니다. 해당 프로젝트에서 ML기반 예측 모델 개발, 점포 단위 방문 고객 지표 개발, 클라우드 기반의 모델 파이프라인 구축 및 배포 업무를 담당했습니다. 시스템 구축 후에는 해당 기업으로부터 데이터 기반의 의사 결정을 통해 매장 매출 및 시설 관리 효율성을 향상시키고, 신규 매장 입점 절차를 간소화할 수 있었다는 평가를 받았습니다.
데이터 과학자로서의 성장과 기여에 대한 포부
세상이 저에게 무엇을 주는지 기다리는 것 보다는 제가 세상에 무엇을 줄 수 있는지 고민하는 자세가 중요하다고 생각합니다. 제가 가진 경험과 기술적 역량을 바탕으로 데이터를 활용하여 주어진 문제를 함께 해결하고 비즈니스 성과를 개선해나가고 싶습니다.
Contact & Link
•
Email: syy258577@gmail.com
•
LinkedIn: Se Young Yoon - Data Scientist
•
Github: lucio-karin0506
Skills
Main Sub
Table
Search
Career
Junior Manager
Golden Planet (2022.06 ~ 2024.03, 1년 10개월)
•
담당 프로젝트
◦
S사 상권 기반 마케팅 플래닝 플랫폼 구축 (2022.06 ~ 2024.01, 1년 8개월)
•
추진 배경 및 목적
◦
급진적인 사업 성장과 그에 따른 점포 증가로 기존의 방식으로는 매장 관리 어려움
◦
전사 및 외부 데이터를 관리하고 상권 기반의 데이터 분석이 가능한 분석 플랫폼 필요
•
기술 스택
◦
Language: Python, SQL
◦
Cloud: GCP
◦
Data Warehouse: Bigquery
◦
Data Preprocessing: Numpy, Pandas
◦
Modeling: Scikit-learn, Tensorflow, Pysurvival, Causal Impact, Optuna, Pycaret
◦
MLOps: Kubeflow, Docker, Vertex AI
•
담당 업무 및 성과
◦
프로시저 생성 및 데이터 마트 구축
▪
문제 정의: 신규점 매출 예측 시, 상권 외부 데이터를 Geo Query로 실시간 처리하는데 많은 시간이 소요됨
▪
해결 방식: 월 단위 점포 거리 반경 및 폴리곤 단위 외부 데이터 집계 프로시저 생성 및 마트 테이블 구성
▪
결과: 신규점 매출 예측 시간 약 83.3% 단축 (기존 약 30초 → 5초)
◦
ML 기반 예측 모델 개발
▪
점포 적자 예측 모델 개발
•
문제 정의: 각 점포 별 시설 재투자 및 폐점 대상 점포를 파악하는데 오랜 시간이 소요됨
•
해결 방식: 점포 개점 이후 적자 사건이 발생하기까지 걸리는 도달 시간 추정 및 적자 발생 위험 확률을 도출하기 위해 생존 분석 모델 적용
•
결과
◦
생존 분석 모델 성능 지표인 c_index 약 0.79, brier_score 약 0.12 기록
◦
적자 위험 점수 7점 이상인 점포들에 한하여 전사 평균보다 약 30% 떨어진 매출액 보임
▪
점포 간 상호 영향도 분석
•
문제 정의: 반경 내 인접 점포 간 이벤트 발생(개점, 폐점, 리모델링, 확장 및 이전)에 따른 점포 간 매출 잠식 현상 발생
•
해결 방식: 동일 반경 내 점포 간 공통 방문 고객 수, 매출액 비중 파악 및 Causal Impact 방법론을 활용하여 이벤트 발생에 따른 매출액 인과 효과 분석
•
결과
◦
이벤트 발생 이전 Causal Impact 모델의 일 평균 RMSE 약 1,347,200원 기록
◦
개점 이벤트 발생 이후 실제 매출액 대비 이벤트 미 발생 예상 매출액 증가
◦
폐점 이벤트 발생 이후 실제 매출액 대비 이벤트 미 발생 예상 매출액 감소
▪
신규 점포 매출 예측 모델 개발
•
문제 정의: 기존의 신규 점포 입점 지역 선정 방식은 직접 입점 후보지를 방문했기 때문에 입점 의사 결정에 오랜 시간이 소요됨
•
해결 방식: 기존 점포 배후지 상권 분석 및 LightGBM 기반 매출 예측 모델 개발
•
결과: R2 약 0.874, MAPE 약 11% 기록
◦
점포 단위 방문 고객 지표 개발
▪
문제 정의: 점포 단위의 방문 고객 지표 미 존재
▪
해결 방식
•
점포 별 충성 고객을 파악하기 위한 정기 고객 지표 개발 및 방문 주기 분석
•
타 지역으로부터 방문한 고객의 비율을 산출하기 위해 고객 별 주거래 지역 및 외부 방문 고객 분석
•
개점 1년 미만 점포들에 한하여 오픈 한 달 이내에 방문한 고객들의 방문 지속률을 파악하기 위해 Cohort Retention을 이용한 개점 월 방문 고객 잔존율 분석 수행
◦
GCP 클라우드 기반 모델 파이프라인 구축 및 배포
▪
문제 정의: 예측 모델 배포 파이프라인 미 존재
▪
해결 방식
•
GCP Vertex-AI, Cloud Function & Scheduler를 활용한 모델 배포 및 예측 배치 작업 수행
•
상권 외부 데이터 집계 파이프라인에서 수급일이 일정하지 않은 외부 데이터에 대하여 일 배치 최신 적재 일자 체크 로직 도입
Staff
Data Studio (2021.07 ~ 2021.09, 3개월)
•
담당 프로젝트
◦
시퀀스 레이블러 및 금융 거래 전략 시스템 개발 (2020.12 ~ 2021.09, 10개월)
(Activity에 기재된 ‘HTS 시스템 개발 및 교내 창업 활동’ 부터 시작한 프로젝트)
•
추진 배경 및 목적
◦
기존 HTS 시스템에서 사용되는 높은 난이도의 거래 전략 작성 간소화
◦
외부 데이터와 결합한 주식 거래 전략 제안
•
기술 스택
◦
Crawling: FinanceDataReader, BeautifulSoup
◦
Data Preprocessing: Numpy, Pandas
◦
Modeling: Scikit-learn
◦
GUI Framework: Pyside2
◦
Visualization: Plotly
•
담당 업무 및 성과
◦
주식 거래 전략 연구 및 수익률 검증
▪
문제 정의: 기존 거래 전략 작성은 사용자 입장에서 난이도가 어려우며 가이드가 부족함
▪
해결 방식
•
기술적 지표 및 거래량을 조합한 파이썬 언어 기반의 전략 조건식 생성 및 가이드 작성
•
거래 전략 조건식 수익률 검증 및 테스트케이스 작성
▪
결과: 파이썬 언어 기반의 간소화된 거래 전략 조건식 제공
◦
GUI 기반 시스템 화면 기획 및 개발
▪
문제 정의: 사용자 입장에서 쉽게 주식 거래 데이터를 분석하고 활용할 수 있는 직관적인 인터페이스 필요
▪
해결 방식
•
6개의 주요 서비스로 구성된 서비스 별 화면 기능 정의 및 설계
•
GUI 프레임워크 Pyside2를 이용한 GUI 화면 개발
•
기술적 및 레이블 지표, 거래량을 반영한 차트 시각화 UI 개발
◦
주가 및 외부 데이터 비교 분석
▪
문제 정의: 기존 HTS 시스템에서는 환율과 같은 외부 데이터를 접목하여 거래 수익률을 개선한 사례가 부족함
▪
해결 방식
•
시가총액 상위 10개 종목에 대하여 기존 거래 전략식에 환율 데이터 반영 및 비교 분석
•
기존 시스템에 주가 및 외부 데이터 비교 분석 기능 추가 반영
▪
결과: 시가총액 상위 10개 종목에 대하여 기존 대비 평균 수익률 7%p 증가
Activity
빅데이터 AI 융합 개발자 양성 과정
한국 소프트웨어 산업 협회 (2021.09 ~ 2022.03, 6개월, 960시간)
•
History
◦
데이터 분석 전문 역량을 키우기 위해 해당 교육 과정 참여
•
교육 내용
◦
웹 프로그래밍
▪
Java, JSP, Spring Framework
◦
데이터베이스
▪
Oracle, SQL
◦
머신러닝
▪
Python, Data Crawling & Handling
▪
통계 기반 머신러닝 이론
◦
딥러닝
▪
Keras, Tensorflow
▪
NLP, 추천시스템
HTS 시스템 개발 및 교내 창업 활동
Data Studio (2020.07 ~ 2021.09)
•
History
◦
주식 투자에 데이터 분석 기술을 접목할 수 있는 것이 흥미로워 해당 활동에 참여
◦
지도 교수님의 자문 및 4명의 지도 학생으로 이루어진 개발 팀 프로젝트
◦
거래 전략 작성 및 백테스팅 기술 서비스화를 위해 2021년 7월에 창업
•
주요 역할
◦
경쟁사 HTS 시스템 리서치
◦
주식 거래 전략 연구 및 수익률 검증
◦
GUI 기반 시스템 화면 기획 및 개발
◦
창업 유치를 위한 발표 자료 작성 및 보고
•
주요 프로젝트
◦
시퀀스 레이블러 및 금융 거래 전략 시스템 개발
Paper
School
기간
2023.03 ~ 재학 중
학교
서강대학교 정보통신대학원
학과
데이터사이언스/인공지능
2016.03 ~ 2022.02
한국공학대학교
(구 한국산업기술대학교)
(학점: 3.76 / 4.5)
소프트웨어공학
Awards
수상 일자
2022.03
주최 기관
한국 소프트웨어 산업 협회
수상 내역
‘빅데이터 AI 융합 개발자 양성 과정’ 최종 프로젝트 발표회 장려상
Certificate
•
SQL 개발자 (SQLD) (취득일: 2021.12.17)
•
정보처리기사 (취득일: 2021.11.26)
•
데이터 분석 준전문가 (ADsP) (취득일: 2019.12.24)