ThorKit
프리랜서 · 진입 난이도 2/5 · 월 수익 월 20~250만원 (작업량 의존)

AI 음성·더빙 외주 부업 — ElevenLabs·TTS 활용

ElevenLabs·OpenAI TTS·Typecast 같은 AI 음성 합성 도구로 유튜브 내레이션, 광고 음성, 오디오북 더빙을 외주로 받아 납품하는 부업입니다. 본인 목소리가 없어도 자연스러운 한국어 더빙이 가능해 진입 장벽이 낮습니다.

업데이트: 2026-05-11
본 가이드는 일반 정보이며 수익을 보장하지 않습니다. 타인 목소리 복제, 유명인 음성 도용은 법적 분쟁의 대상이 됩니다.

AI 음성·더빙 외주는 ElevenLabs, OpenAI TTS, Typecast(타입캐스트), 클로바 더빙 같은 AI 음성 합성 도구로 유튜브 내레이션·광고 음성·오디오북·전화 안내멘트를 만들어 납품하는 부업입니다. 본인 발성·녹음 환경이 없어도 자연스러운 한국어 더빙이 가능해 진입 장벽이 낮은 편입니다.

다만 "AI 그대로 뽑은 음성"은 시장 단가가 빨리 떨어지는 흐름이라, 어조·강세·호흡을 수동으로 조정하고 BGM·효과음과 함께 묶어 납품하는 쪽이 살아남습니다.

1. 주요 작업과 단가

  • 유튜브 내레이션: 1분 1만~3만원 (10분 기준 10만~30만원)
  • 광고·홍보 영상 더빙: 30초 5만~15만원
  • 전화 안내멘트(ARS): 5~10문장 3만~10만원
  • 오디오북 더빙: 시간당 10만~30만원 (장편은 정기 작업 형태)
  • 캐릭터 보이스(게임·웹툰): 컷당 5,000원~3만원
  • 외국어 → 한국어 더빙: 분당 2만~5만원

2. 어떤 도구를 쓰나요?

  • ElevenLabs — 영문·다국어 자연스러움 최상위, 한국어도 빠르게 개선 중, 월 $5~99
  • OpenAI TTS (gpt-4o-audio·tts-1) — API 기반, 1분당 약 30~60원, 자동화 강함
  • Typecast (타입캐스트) — 한국 회사, 한국어 톤·캐릭터 다양, 월 1.5만~10만원대
  • 네이버 클로바더빙 — 한국어 자연스러움, 영상 편집기 통합
  • Murf·PlayHT — 글로벌 시장, 영문 외주에 강세
  • DAW(오다시티·Adobe Audition) — 후보정·BGM 믹싱

3. 진입 절차

  • 1~2주차: 도구 2~3개 결제 후 같은 대본을 여러 톤으로 30~50개 뽑아 비교
  • 3~4주차: 본인 강점(차분한 정보형·밝은 광고형·캐릭터형 등) 1개 정하기
  • 1개월차: 샘플 음성 5~10개를 유튜브·노션·인스타에 정리
  • 1~2개월차: 크몽·숨고 등록, 단가 낮게 시작해 후기 5~10건 확보
  • 3개월차: BGM·효과음 합성까지 패키지로 묶어 단가 인상

4. 판매 채널

  • 크몽 — "음악·오디오 → 더빙·내레이션" 카테고리
  • 숨고 — 자영업자 ARS 안내·매장 방송용
  • 오투잡 — 소액 외주
  • Fiverr·Upwork — 영문 더빙 시장
  • 유튜버·강사 DM 직접 컨택 — 정기 거래로 이어지기 쉬움

5. 저작권·초상권 — 가장 중요한 부분

  • 실존 인물(연예인·정치인) 목소리 복제: 명백한 초상권·인격권 침해
  • 사망자 목소리 복제도 유족 동의 없이는 분쟁 위험
  • ElevenLabs Voice Clone: 본인 음성 또는 동의받은 화자만 사용 (약관 명시)
  • 성우·배우 목소리 톤 흉내내기 의뢰는 거절 권장
  • BGM·효과음: Epidemic Sound·Artlist 등 라이선스 음원 사용
  • 출처: 한국저작권위원회 copyright.or.kr, 방송통신심의위원회

6. 어떤 사람이 잘 맞나요?

  • 유튜브·릴스 편집 경험자 — 음성 + 영상 묶음 납품 가능
  • 외국어 가능자 — 영문·일문 더빙 단가가 높음
  • 라디오·팟캐스트 좋아하는 사람 — 톤 감각이 빠르게 잡힘
  • ASMR·낭독 채널 운영자 — 본인 채널 + 외주 병행

7. 세금·사업자

  • 크몽·숨고 정산: 3.3% 원천징수 사업소득
  • 연 매출 1,200만원 넘어가면 간이과세자 등록 권장
  • 해외 플랫폼(Fiverr) 결제: 외환 송금 + 종합소득세 신고
  • 5월 종소세 신고 시 합산

8. 함정·주의점

  • "AI 그대로" 납품은 단가가 빠르게 떨어짐 — 호흡·강세 수동 조정 필수
  • 한국어 발음에서 특정 외래어(브랜드명)는 어색하게 나오는 경우가 흔함 — 검수 단계 추가
  • ElevenLabs 무료 플랜 음성은 상업 이용 제한 — 유료 플랜 필수
  • 고객사가 정치인·연예인 톤 따라하기를 요구하면 명확히 거절
  • 음성 파일 납품 후 "AI 사용 명시" 요청하는 플랫폼이 늘고 있음 (예: 유튜브)

관련 계산기

자주 묻는 질문

ElevenLabs랑 Typecast 중 뭐가 더 좋나요?
한국어 자연스러움은 Typecast·클로바더빙이 안정적인 편이고, 다국어·감정 표현은 ElevenLabs가 더 강합니다. 한국 의뢰가 많다면 Typecast를 메인으로 두고 ElevenLabs는 외국어·캐릭터 톤용으로 쓰는 분이 많습니다.
본인 목소리가 안 좋아도 가능한가요?
가능합니다. AI 음성을 그대로 쓰는 일이라 본인 발성·녹음 환경이 필요 없습니다. 다만 "어떤 톤이 영상에 맞는지" 고르는 감각은 본인 몫이라, 평소 유튜브·라디오를 톤 기준으로 분석해 보는 게 도움이 됩니다.
연예인 톤으로 더빙해 달라는 의뢰가 들어왔어요. 해도 되나요?
거절을 권장합니다. 실존 인물의 목소리는 인격권·초상권 대상이고, 최근에는 AI 음성 복제 사건이 사회 이슈로 다뤄지면서 법원 판단도 엄격해지는 흐름입니다. 게다가 ElevenLabs·Typecast 약관에서도 명시적으로 금지하고 있어 계정 정지 위험이 있습니다.
초보가 처음 한 달에 얼마나 벌 수 있나요?
후기 0건 상태로 시작하면 한 달 5~20만원 수준이 일반적입니다. 후기 10건 이상 모이면 월 50~100만원 구간이 흔하고, 영상 편집까지 묶어 패키지로 팔면 월 150~250만원도 가능합니다.