Career

데이터 엔지니어가 되려면? 분석가·개발자에서 전환하는 로드맵

분석가에서, 백엔드 개발자에서 데이터 엔지니어로 전환하려면 무엇을 채워야 할까요? 토스·쿠팡·카카오뱅크 채용공고로 본 핵심 스킬, 출발점별 갭 분석, 6개월 학습 로드맵, 면접 단골 주제까지 한 번에 정리했어요.
2026.05.24
데이터 엔지니어가 되려면? 분석가·개발자에서 전환하는 로드맵

"분석가에서 데이터 엔지니어로 가야 할까, 백엔드에서 데이터 엔지니어로 가야 할까?"

요즘 데이터 직군 전환을 고민하는 분들이 가장 많이 하는 질문이에요. 채용공고는 폭발적으로 늘었는데, 막상 토스·쿠팡·카카오뱅크 공고를 열어보면 Spark·Airflow·Kafka·dbt·Hadoop·Snowflake가 줄줄이 나와서 어디부터 채워야 할지 막막하죠[3][4][5].

이 글에서는 출발점이 다르면 로드맵도 달라야 한다는 관점으로 정리했어요. 1) DA·DE·SWE의 차이 2) 분석가에서 전환할 때 무기와 갭 3) 개발자에서 전환할 때 무기와 갭 4) 핵심 스킬셋 표 5) 6개월 전환 로드맵 6) 채용공고에서 자주 보이는 키워드와 면접 단골 주제

본인이 어디에서 출발하는지 먼저 짚고, 갭만 채우는 가장 빠른 길을 찾아보세요. 커리어 탐색에서 본인 직무에 맞는 다음 단계를 미리 그려두면 학습 우선순위를 잡기 더 쉬워요.

이미지 placeholder — alt: "데이터 분석가와 백엔드 개발자가 각각 데이터 파이프라인 다이어그램을 향해 다른 길로 합류하는 일러스트"


1. DA, DE, SWE는 무엇이 다를까요?

데이터 엔지니어(DE) 는 "데이터 수집·저장·변환·분석을 가능하게 하는 인프라를 설계·구축·관리하는 일"을 해요[1]. dbt Labs는 한 줄로 더 직관적으로 표현하기도 해요. "Data engineers are the people who move data from outside of your ecosystem into your ecosystem."[1]

세 직무를 한 줄씩 비교하면 이렇게 정리할 수 있어요.

직무

주된 관심사

산출물

데이터 분석가 (DA)

데이터에서 인사이트 도출

대시보드, 리포트, A/B 테스트 결과

데이터 엔지니어 (DE)

데이터 인프라·파이프라인 안정 운영

DW/마트, ETL 파이프라인, 스트리밍 시스템

소프트웨어 엔지니어 (SWE)

서비스 로직·API 구현

사용자 기능, 트랜잭션 처리 시스템

스파크플러스의 정리도 같은 맥락이에요. "데이터 엔지니어는 데이터 분석가나 사이언티스트가 편하게 일할 수 있도록 환경을 만들어주는 사람."[7] DE는 분석을 직접 하는 직무가 아니라, 분석이 가능한 토대를 만드는 직무라고 보면 돼요.


2. 데이터 분석가 → 데이터 엔지니어: 무기와 갭

가지고 있는 무기

  • SQL 숙련도 — 토스 공통 자격요건은 'SQL 상급'이에요[3]. 분석가로 일하면서 다져둔 윈도우 함수·조인·CTE 감각은 그대로 무기가 돼요.

  • 도메인·비즈니스 이해 — 어떤 지표가 신뢰할 만한지 아는 감각은 모델링 단계에서 결정적이에요.

  • 데이터 품질 감각 — 잘못된 데이터를 알아보는 눈은 ETL 검증 단계에서 큰 자산이에요.

채워야 할 갭

한 분석가 출신 전환자는 후기에서 이렇게 표현했어요. "데이터가 이쁘게 있으면 그걸 분석할 생각만 했지, 그 데이터가 어디에서 나오는지에 대해서는 깊이 있게 생각해보지 않았다."[6] 정확히 분석가에서 DE로 갈 때 채워야 할 갭이에요.

왜 필요한가요?

분산 처리 (Spark/PySpark)

토스·쿠팡 공통으로 요구되는 빅데이터 프레임워크[3][4]

워크플로우 오케스트레이션 (Airflow)

토스 공통 자격요건에 'Python 중급(Airflow 운영 가능)' 명시[3]

클라우드 (AWS/GCP)

EMR, S3, BigQuery 등 DE 작업 환경 자체[4]

시스템 설계·CI/CD

dbt 인스턴스 유지, Airflow 파이프라인 관리, CI/CD 운영이 일상 업무[1]

우선순위

SQL은 이미 강하니, 분산 처리(PySpark) → Airflow → 클라우드(S3/EMR) → CI/CD 순서로 갭을 메우는 게 가장 빠른 길이에요.


3. 백엔드 개발자 → 데이터 엔지니어: 무기와 갭

가지고 있는 무기

  • 시스템 설계·운영 경험 — 토스증권은 Hadoop·Airflow·dbt·Spark 위에 k8s까지 얹어 운영해요[3]. SWE 백그라운드의 컨테이너·CI/CD 경험이 그대로 살아요.

  • Python 또는 Java/Scala 숙련도 — 쿠팡은 Java·Scala·Python 중 1개 능숙 사용을 요구해요[4].

  • 클라우드 운영 감각 — AWS·GCP를 이미 다뤄봤다면 EMR·S3·BigQuery로 옮겨가는 비용이 적어요.

채워야 할 갭

왜 필요한가요?

데이터 모델링 (차원 모델링·DW 설계)

토스 공통 자격요건의 '데이터 모델링 역량'·'DW 설계/운영'에 직접 매칭[3]

SQL 깊이

단순 CRUD가 아닌 분석 쿼리·윈도우 함수·튜닝 감각

분석 메트릭 이해

비즈니스 지표가 어떻게 정의되고 활용되는지

데이터 품질·거버넌스

Databricks 자격증의 데이터 거버넌스/품질 영역(11%)이 가리키는 부분[2]

우선순위

데이터 모델링(스타 스키마·SCD) → 분석 SQL 심화 → DW(BigQuery·Snowflake) → 데이터 품질 도구(dbt 테스트) 순서로 채우는 게 효율적이에요.


4. 데이터 엔지니어 핵심 스킬셋

스파크플러스가 정리한 7대 핵심 역량을 기준으로[7], 한국 채용공고[3][4][5]에서 자주 보이는 도구를 매칭하면 다음과 같아요.

영역

대표 도구

왜 중요한가요?

SQL & 프로그래밍

SQL, Python, Scala/Java

모든 공고의 공통 필수[3][4]

분산 처리

Spark, PySpark

대용량 처리의 사실상 표준[2][4]

워크플로우

Airflow

토스·카카오뱅크 공통[3][5]

메시지 브로커

Kafka, Flink

카카오뱅크 실시간 파이프라인 표준[5]

데이터 변환

dbt

토스인컴·토스증권 도입[3]

데이터 웨어하우스

Snowflake, BigQuery, Redshift

토스인컴(Snowflake) 명시[3]

클라우드

AWS, GCP, Azure

EMR·S3·BigQuery 등[4]

데이터 모델링

차원 모델링, 스타 스키마

토스 공통 자격요건[3]

특히 토스 채용공고에서 자주 등장하는 키워드는 "DW 데이터 모델러로서 담당 제품의 주요 개념을 명확하게 정의하고 쉽고 명확한 데이터 구조 디자인"[3] 처럼 데이터 모델링이 핵심이라는 신호를 반복해서 줘요.


5. 6개월 전환 로드맵

스파크플러스 학습 단계(CS 기초 → 언어 → DB → DW → 클러스터 컴퓨팅 → 워크플로우 → 모니터링 → 보안)[7]를 전환자 6개월 압축안으로 다시 짠 버전이에요.

0~2개월: 기반 다지기

  • SQL 심화: 윈도우 함수, CTE, 실행 계획

  • 데이터 모델링: 스타 스키마, 차원 모델링, SCD(Slowly Changing Dimension)

  • Python 데이터 처리: pandas → PySpark 기초

2~4개월: 파이프라인 만들어 보기

  • Airflow로 작은 ETL 파이프라인 구축 (예: 공공데이터 → S3 → BigQuery)

  • AWS S3·EMR 또는 GCP BigQuery 실습

  • dbt로 변환 모델링 프로젝트

4~6개월: 포트폴리오와 면접 준비

  • Kafka 스트리밍 토이 프로젝트 (실시간 로그 → Spark Structured Streaming → 적재)

  • 한 분석가 출신 전환자도 포트폴리오에서 "이유 있는 기술 선정"과 트러블슈팅 기록을 핵심으로 강조했어요[8].

  • 채용공고 키워드 매칭 + 면접 준비

같은 후기에서 그 분은 약 50개 기업에 지원해 10개 합격(20%)을 기록했어요[8]. 합격률을 일반화할 수는 없지만, 여러 회사를 돌려보며 면접 자체에서 학습한다는 접근은 참고할 만해요.


6. 채용 키워드와 면접 단골 주제

채용공고에서 자주 등장하는 키워드

한국 주요 회사 공고를 모아 보면 같은 단어가 반복돼요.

  • 공통: SQL, Python (또는 Java/Scala), Airflow, Spark, 데이터 모델링, DW

  • 회사별 특화: Snowflake·dbt(토스인컴), Hadoop·Impala·PySpark(토스 Core), Kafka·Flink(카카오뱅크), EMR·Hive(쿠팡)[3][4][5]

이력서·자기소개서를 쓸 때 본인이 가진 경험을 이 키워드들과 매핑해 두면, 트리업의 스킬 관리에서 관리하는 보유 스킬과 자연스럽게 연결돼요.

면접 단골 주제

한 DE 면접 후기[9]를 정리하면 카테고리는 이렇게 잡혀요.

카테고리

자주 나오는 주제

데이터 플랫폼

DW, RDB, ETL/ELT, HDFS, S3, Elasticsearch

메시징·스트리밍

Kafka, 로드밸런싱

분산 컴퓨팅

Spark 파티셔닝·셔플, 분산 처리 기본

인프라/DevOps

K8s, CI/CD, AWS

모니터링·로깅

Prometheus, Grafana, ELK/EFK

행동 면접

자기소개, 갈등 해결, 회사 vs 개인 성장, 기술 깊이 검증

여기에 토스 공고가 강조하는 데이터 모델링 질문(스타·스노우플레이크 스키마, 정규화·역정규화 트레이드오프) 을 더하면 면접 대비 범위가 거의 채워져요[3].


7. 시장 현황: 수요와 연봉

Stack Overflow 2025 Developer Survey 기준 데이터 엔지니어링 직무의 미국 중간 연봉은 $150,000로 전년과 동일했어요[10]. 전 세계적으로 "성장은 이어지고 있지만 폭발적인 추가 상승은 둔화" 단계라고 볼 수 있어요.

한국 시장은 출처에 따라 차이가 있지만, 한 분석에서는 10년차 이상 시니어 빅데이터 엔지니어의 평균 연봉을 약 7,776만 원으로 집계했어요[11]. 같은 분석은 "AI·클라우드·데이터 엔지니어링 분야는 수요 급증으로 연봉 상승률이 높다" 고 정리해요[11]. 신입~3년차 구간은 회사·도메인 차이가 커서 단일 평균을 인용하긴 어렵지만, 시니어 곡선이 가파른 직군이라는 점은 참고할 만해요.


마무리

데이터 엔지니어는 갑자기 등장한 새 직무가 아니라, 분석가의 SQL·도메인 감각과 개발자의 시스템 사고가 만나는 지점이에요. 그래서 출발점이 다르면 채워야 할 갭도 다르고, 로드맵도 달라요.

  • 분석가 → 데이터 엔지니어: SQL은 그대로, 분산 처리·워크플로우·클라우드·CI/CD 를 채우세요.

  • 개발자 → 데이터 엔지니어: 시스템 감각은 그대로, 데이터 모델링·분석 SQL 깊이·DW·데이터 품질 을 채우세요.

  • 공통: Spark, Airflow, Kafka, dbt, AWS/GCP, 데이터 모델링은 모든 공고의 공통어예요[3][4][5].

본인의 무기를 정리하고 갭만 6개월 단위로 채우면, 데이터 엔지니어로 가는 길은 생각보다 가까워져요. 작은 노력들이 모여 큰 성장을 만들어요. 오늘 어디서 출발할지부터 정해 보세요!


Footnotes

Airflow
백엔드 개발자
데이터 분석가
커리어 전환
dbt
데이터 엔지니어
Kafka
데이터 모델링
Spark
Updated 2026.05.10

Recommended for you

  • DevOps 엔지니어 커리어 가이드 — 백엔드에서 인프라로 가는 길
    Career
    백엔드 개발자가 DevOps 엔지니어로 전환하는 6-12개월 로드맵을 정리했어요. DevOps·SRE·Platform Engineer 차이, 핵심 스킬셋, 채용공고 키워드, 한국 시장 연봉까지 한 번에 알려드려요.
  • 모바일 개발자 면접 질문 TOP 10 - iOS·Android 공통 핵심
    Interview
    주니어 모바일 개발자가 iOS·Android 면접에서 자주 받는 질문 10가지를 면접관 의도, 핵심 답변 포인트, follow-up, 자주 빠지는 함정까지 한 번에 정리했어요. 공식 문서 기반이에요.
  • AWS 입문자가 처음 익혀야 할 서비스 7가지 - 신입 개발자 필수 클라우드
    Skill Roadmap
    AWS 200+ 서비스 중 신입 개발자가 가장 먼저 익혀야 할 7가지를 채용 시장 기준으로 정리했어요. EC2, S3, RDS, Lambda, IAM, CloudWatch, VPC 핵심 개념과 자주 하는 실수까지 한 번에 확인하세요.
  • 백엔드 개발자가 자주 쓰는 디자인 패턴 5가지 — 면접 단골 질문 정리
    Interview
    GoF 23개 패턴을 다 외울 필요 없어요. Singleton, Factory Method, Strategy, Observer, Proxy — 백엔드 주니어 면접에서 자주 묻는 5개 패턴을 한 줄 정의·코드·follow-up 질문까지 한 번에 정리했어요.
  • 기획자에서 PM으로 전환하기 - 도메인 지식을 무기로 만드는 5단계
    Career
    서비스 기획자에서 PM·PO로 전환하려면 무엇이 필요할까요? 한국 IT 채용 공고와 토스·쿠팡 사례로 본 기획자의 무기 3가지, 채워야 할 갭 3가지, 이력서·면접 재프레이밍까지 한 번에 정리했어요.
  • AI 시대 살아남는 주니어 개발자 - 대체되지 않는 5가지 역량
    Career
    Copilot이 코드를 짜주는 시대, 주니어 개발자가 진짜 키워야 할 다섯 가지 역량을 Stack Overflow와 McKinsey 데이터로 정리했어요. 문제 정의, 시스템 설계, 코드 리뷰 깊이, 도메인 이해, 협업까지 면접·이력서에 바로 쓰는 가이드예요.