토스 메이커스 컨퍼런스 2025 참석 후기: 대규모 서비스의 기술적 진화를 엿보다
참석일: 2025년 7월 25일 (금)
장소: 코엑스 컨벤션센터
주요 세션: 10개 기술 세션 참석
🚀 들어가며
토스 메이커스 컨퍼런스 2025에 참석하며 가장 인상 깊었던 점은 "실패를 감추지 않고 드러내며 빠르게 공유하여 다음 선택의 근거로 삼는다"는 토스의 기술 철학이었습니다.
20년 된 레거시 시스템의 현대화부터 최신 ML 플랫폼 구축까지, 각 세션에서 공유된 내용은 단순한 성공 사례가 아닌 시행착오와 해결 과정이 담긴 진솔한 경험담이었습니다.
💎 핵심 인사이트
1️⃣ 레거시는 짐이 아닌 자산이다
"20년 레거시를 넘어 미래를 준비하는 시스템 만들기" 세션에서 가장 놀라웠던 점은 토스가 2020년 인수한 20년 된 결제 시스템을 완전히 새로 만들지 않고 점진적으로 현대화했다는 것입니다.
현대화 전략:
- Git 도입으로 코드 관리 체계화
- MSA 전환 (150개+ 마이크로서비스)
- 4개 AZ 분산 Kubernetes 클러스터
- Java 17/21 사용률 50% 이상 달성
핵심 교훈: 레거시를 적으로 보지 말고, 비즈니스 가치를 인정하면서 단계적으로 개선하는 것이 현실적이고 효과적입니다.
2️⃣ 분산 시스템의 새로운 패러다임
"현장결제 서비스의 분산 트랜잭션 관리학 개론"에서 소개된 트리 구조 기반 트랜잭션 관리는 기존의 2PC나 Saga 패턴과는 완전히 다른 접근법이었습니다.
문제: 2개 트랜잭션 → 16가지 경우의 수
4개 트랜잭션 → 256가지 경우의 수
해결: 트리 구조 + Resolve 메커니즘
- 각 노드가 직계 하위 노드 상태만 관리
- 복잡도를 O(1) 서브트리 단위로 축소
- 양방향 보정 (재시도 + 롤백)
핵심 교훈: 복잡한 문제를 해결할 때는 기존 패턴에 얽매이지 말고, 문제의 본질을 이해하여 새로운 접근법을 시도해볼 용기가 필요합니다.
3️⃣ 설정 관리도 소프트웨어 개발이다
"수천 개의 API/BATCH 서버를 하나의 설정 체계로 관리하기"에서 인상 깊었던 점은 설정을 코드처럼 설계하고 관리한다는 철학이었습니다.
Overlay Architecture:
App (최고 우선순위)
↓
AppGroup
↓
Phase
↓
Cluster
↓
Global (기본값)
특징:
- 템플릿 시스템으로 중복 제거
- Python 스크립트 주입으로 동적 설정
- JobDSL로 배치 작업 코드화
핵심 교훈: 설정 관리를 단순한 파일 관리로 보지 말고, 소프트웨어 개발의 관점에서 접근하면 훨씬 체계적이고 확장 가능한 시스템을 만들 수 있습니다.
🏗️ 아키텍처 혁신 사례
ScyllaDB로 극한 성능 달성
토스뱅크의 Online Feature Store에서 ScyllaDB를 선택한 이유와 운영 경험이 매우 실용적이었습니다.
성능 지표:
- 쓰기: 120,000 TPS, P99 < 5ms
- 읽기: P99 < 5ms 안정적 유지
- 처리량: 매일 수천만건 적재
주의사항:
- Large Partition 관리 (100MB+ 파티션 문제)
- Full Scan 쿼리 제어 필요
- 중간 Feature Server로 쿼리 검증
핵심 교훈: 새로운 기술 도입시 성능만 보지 말고, 운영 복잡도와 함정까지 고려해야 합니다.
결제 시스템의 CQRS + 이벤트 기반 전환
"확장성과 회복탄력성을 갖춘 결제시스템 만들기"에서 가장 인상 깊었던 점은 실제 장애 사례와 해결 과정을 숨김없이 공유한 것이었습니다.
주요 장애와 해결:
1. DB 부하 → 인덱스 힌트로 옵티마이저 제어
2. 타임아웃 불일치 → 전체 서버 체인 타임아웃 재설정
3. 이벤트 누락 → 아웃박스 패턴 + 보상 트랜잭션
4. 데이터 불일치 → 두 원장간 보정 배치 운영
핵심 교훈: 완벽한 시스템은 없다. 중요한 것은 시스템이 스스로 회복할 수 있는 구조를 만드는 것입니다.
🎯 개발 조직의 성장
Infrastructure as Code의 진화
"성장하는 엔터프라이즈를 위한 인터널 서비스 제공 전략"에서는 토스가 어떻게 계열사 확장에 대응했는지 볼 수 있었습니다.
해결 전략:
- Terraform으로 인프라 "찍어내기"
- ArgoCD로 Kubernetes 리소스 관리
- Config Store로 MSA 환경 설정 통합
- Gateway Plugin으로 공통 로직 처리
핵심 교훈: 조직이 성장할 때는 사람이 늘어나는 것보다 자동화와 추상화가 더 중요합니다.
배치 시스템의 완전한 재구축
"레거시 정산 개편기"에서는 20년 된 정산 시스템을 어떻게 현대적으로 재구축했는지 상세히 다뤘습니다.
성능 최적화 3법칙:
1. 캐싱: 가맹점 설정정보 메모리 캐시
2. 벌크 처리: 래퍼 클래스로 배치 처리
3. JDBC Batch Insert: N번 → 1번 처리
결과:
- 처리 성능: 최대 10배 향상
- 2,100개 배치 자동화 관리
- 하루 수천만건 안정적 처리
핵심 교훈: 성능 최적화의 핵심은 I/O 최소화입니다.
🧠 개발자 성장의 과학
권태기 극복의 3가지 전략
마지막 세션 "개발자 권태기, 10년 동안 이렇게 이겨냈습니다"는 기술적 내용은 아니었지만, 가장 실용적인 세션이었습니다.
1. 일상 무료함 탈출 (Flow 이론):
- 명확한 목표 + 적절한 난이도 + 즉각적 피드백
- 매일 작은 도전 추가
2. 동기 회복 (자기결정성 이론):
- 자율성: 스스로 선택하는 일
- 유능감: 기술적 성장 체감
- 관계성: 동료와의 협업
3. 번아웃 예방:
- 수면 위생이 핵심 (한국 OECD 수면시간 꼴등)
- 침실은 수면 전용, 20도 유지
핵심 교훈: 개발자도 사람이다. 기술적 성장만큼 심리적 웰빙도 중요합니다.
📊 실시간 데이터 처리의 현실
Apache Druid vs StarRocks
"고객은 절대 기다려주지 않는다" 세션에서는 두 OLAP 엔진의 실제 사용 경험을 비교해볼 수 있었습니다.
Apache Druid:
장점: 시계열 특화, 비트맵 인덱스, 월 5천만원 절감
한계: 멱등성 부족, 스키마 변경 어려움, 운영 복잡
StarRocks:
장점: 멱등성 지원, CDC 네이티브, 조인 성능 84.6% 개선
특징: Colocation Group으로 로컬 조인
현재: 하이브리드 운영 (각각의 장점 활용)
핵심 교훈: 완벽한 솔루션은 없다. 상황에 맞는 하이브리드 접근이 현실적입니다.
🎯 마무리: 토스에서 배운 것들
기술 철학
- 점진적 개선: 완벽한 시작보다 지속적인 개선
- 실패 공유: 실패를 숨기지 않고 학습 자산으로 활용
- 자동화 우선: 반복 작업의 자동화로 창조적 업무에 집중
- 개발자 경험: 기술적 우수성과 개인 성장의 조화
즉시 적용해볼 것들
- 설정 관리의 체계화 (계층형 구조 도입)
- 배치 작업의 코드화 및 자동화
- 카나리 배포를 통한 안전한 시스템 전환
- 개발자 권태기 예방을 위한 작은 도전들
장기적으로 고민해볼 것들
- 레거시 시스템의 점진적 현대화 전략
- 분산 트랜잭션 관리 방식 개선
- Infrastructure as Code 도입
- 실시간 데이터 처리 아키텍처 고도화
토스 메이커스 컨퍼런스의 가장 큰 가치는 '완벽한 해답'을 제시하는 것이 아니라, '시행착오와 학습의 과정'을 공유한다는 점이었습니다.
대규모 서비스를 운영하며 겪는 현실적인 문제들과 그 해결 과정을 통해, 기술 선택의 트레이드오프와 실무진의 고민을 엿볼 수 있었습니다.
기술 컨퍼런스 참석이 단순한 트렌드 파악을 넘어 실무에 바로 적용할 수 있는 구체적인 인사이트를 얻을 수 있는 소중한 경험이었습니다.
본 후기는 토스 메이커스 컨퍼런스 2025 참석 후 개인적인 관점에서 작성되었으며, 실제 발표 내용을 바탕으로 구성되었습니다.
'📈 Career & Growth > 🎤 Conference & Community' 카테고리의 다른 글
TSBM 7월 밋업 후기 (0) | 2025.09.03 |
---|---|
AI 시대, 개발자는 어떻게 살아남을 것인가? (0) | 2025.07.21 |
NAVER DAN 24 DAY 2 후기 (3) | 2024.11.17 |
2024 당근 테크 밋업 후기 (6) | 2024.10.07 |
판교 퇴근길 밋업 - 가을 특집 with 개발바닥 후기 (4) | 2024.09.27 |