범용 콘텐츠 파이프라인 — 콘텐츠 유형·언어 무관, settings.json만 바꾸면 됨
| 구분 | rushindrasinha (Shorts) | darkzOGx (에이전트) | autoworker (레퍼런스) | ✅ 우리 설계 |
|---|---|---|---|---|
| 단계 수 | 3단계 | 5 에이전트 | 8단계 | 6단계 |
| 병렬 처리 | ❌ | ❌ | ❌ | ✅ Stage 3 |
| Resume 지원 | ✅ | ❌ | ❌ | ✅ |
| 핵심 약점 | 롱폼 구조 부족 | 미디어 제작 없음 | 느림, 비효율 | — |
settings.json 채널 설정topic 주제 또는 키워드_refs/concept.md_refs/research.jsonconcept.mdstyle_guide (settings에서)_script/outline.md_script/script.txt (씬 마커 포함)_script/storyboard_hints.json_script/qa_report.md"human_review_script": true이면 대본 승인 후 Stage 3 진행. false 시 end-to-end 완전 자동.
audio/scene_XX.mp3captions/full.srtimages/scene_XX.pngclips/scene_XX.mp4audio/ 보이스오버 파일clips/ 비디오 클립captions/full.srt_assets/music/bgm.mp3output/video_draft.mp4thumbnail.png (2-3종) + youtube.md| 도구 | 무료 플랜 | 유료 시작가 | 다국어 | 품질 | 추천 |
|---|---|---|---|---|---|
| ElevenLabs | 10k 크레딧/월 | $5/월 | 30+ 언어 | ★★★★★ | 메인 |
| Edge-TTS (Microsoft) | 완전 무료 | — | 다국어 | ★★★★ | 폴백 |
| Google Cloud TTS | 100만자/월 | $4/100만자 | 40+ 언어 | ★★★★ | — |
| NAVER CLOVA Voice | 유료만 | 종량제 | 한국어 특화 | ★★★★★ | 한국어 전용 시 |
| 도구 | 무료 | API 단가 | 품질 | 상업적 사용 |
|---|---|---|---|---|
| Gemini Imagen 3 | 제한적 무료 | $0.03/장 | ★★★★ | ✅ |
| Flux 1.1 Pro | 유료 | $0.04/장 | ★★★★★ | ✅ |
| Flux Dev (로컬) | 완전 무료 | HW 비용만 | ★★★★★ | 비상업 |
| DALL-E 3 | 유료 | $0.04-0.08/장 | ★★★★ | ✅ |
| Stable Diffusion | 완전 무료 | HW 비용만 | ★★★★ | ✅ |
| 순위 | 도구 | 무료 | 유료 시작가 | 품질 (Elo) |
|---|---|---|---|---|
| 1 | Runway Gen-4.5 | 유료 | $15/월 | 1,247 |
| 2 | Google Veo 3 | Gemini 내 | $20/월 | 1,226 |
| 3 | Kling 2.5 Turbo Pro | 유료 | $10/월 | 1,225 |
| 6 | Hailuo 02 | 유료 | $14.99/월 | 1,208 |