윈도우즈 Applio 에서 가수 배호의 목소리 AI Cover 로 트로트를 더빙해보자

인공지능응용: AI Cover

윈도우즈 Applio 에서 가수 배호의 목소리 AI Cover 로 트로트를 더빙해보자

coding art 2026. 2. 15. 00:50

728x90

왜 가수 배호의 노래 목소리 AI Cover 를 만들어 보는걸까? 조용필, 남진, 나훈아와 같은 대단한 가수들이 있긴 하지만 아직은 현역이라 좋은 노래들이 계속 발표되고 있기때문에 그다지 아쉬움은 없을 것이다. 하지만 배호처럼 이미 작고한 가수의 경우 불현듯 그 생생했던 노래소리가 그리워지는 것 아닐까?

한편 그래서 모창 가수를 찾아보니 아니나 다를까 정말 가수 배호의 목소리를 그대로 빼다박아 너무나 재미나는 월연 스님이라는 가수분도 계셔 AI Cover 작업하는 기간이 대단히 즐거웠다. 재미로 들어보시길 권한다.

https://www.youtube.com/watch?v=-EnbJ994y1Q&list=RD-EnbJ994y1Q&start_radio=1

1. 유튜브 URL 주소로 MP3 Converter에서 음악(목소리+반주)를 추출하자.

https://ejleep1.tistory.com/1700

2. MP3 노래파일로부터 목소리[Vocal]를 추출하자.

https://ejleep1.tistory.com/1702

3. Gemini 코칭에 따른 노래 목소리 분리 UVR5 설치

https://ejleep1.tistory.com/1708

※ 2번이나 3번에 의해서 추출된 좋아하는 노래 MP3 파일을 입력하여 목소리(Vocal)만 분리하자.

목소리 파일들을 AI 에 학습시키도록 하자.

RVC WebUI 라고 해서 많은 오픈소스 실행 파일들이 유포되어 있으나 사용자들이 실행이 거의 불가능한듯하다. 그 이유는 상당히 많은 양의 사전 학습 데이터들을 불러와 PIP 명령을 사용해 설치해야 하는데 이미 상실된 데이터들이 꽤 있는 듯하며, 사용하는 라이브러리 Version 들이 서로 맞지 않아 끝없이 수많은 에러가 발생한다.

목표는 10곡이지만 현재 2곡을 선정하여 학습을 시도하는 중이다. 배호의 노래는 과거 레코드 회사에서 음반이 발매 되었기때문에 잡음(Noise) 와 울림(Reverbration)이 거의 없다. 수많은 곡들이 있지만 잘 알려졌으면서 음역을 고려하여 10곡을 선정하였다.

AI Cover 작업을 위해서 다음 사이트 내용을 참조하자.

https://github.com/RVC-Project/Retrieval-based-Voice-Conversion-WebUI/blob/main/docs/en/README.en.md

Applio 는 리눅스, MacOs 버전 및 Windows10 버전들이 있다. 여기서는 Windows 10 에 설치하기 위해 Applio.org 에서 ApplioV3.5.1 을 다운받아

상당한 시간에 걸쳐에 걸쳐 압축을 해제하여 C 드라이브에 설치하자.

압축이 해제되면 다음 파일들이 얻어진다. run-applio.bat 파일을 더블 클릭해 실행하자.

다음과 같이 flask workframe 에서 보았던 http://127.0.0.1:6959 웹URL 주소에

검은색 디스플레이 판넬 화면이 나타난다. Size 가 커서 스크린을 벗어나므로 스크롤 기능을 사용하든지 아니면 디스플레이 해상도를 67%에 맞추면 된다.

아울러 다음과 같이 메세지 창이 뜨며 어떤 에러 가능성을 암시하고 있기에 Gemini 에게 문의해 보았다.

드디어 실행이 되셨군요! 터미널에 뜬 메시지를 보니 두 가지 중요한 상태를 확인할 수 있습니다. 하나는 경고(Warning)이고, 하나는 성공(Success)입니다.

현재 상황을 정리해 드릴게요.

1. 🚀 프로그램은 이미 실행되었습니다!

가장 마지막 줄에 있는 http://127.0.0.1:6969 문구에 주목해 주세요.

방법: 웹 브라우저(크롬, 엣지 등)를 열고 주소창에 http://127.0.0.1:6969를 입력한 뒤 엔터를 누르세요.
Applio의 제어 화면이 나타난다면 성공적으로 실행된 것입니다.

2. ⚠️ 해결해야 할 문제: NVIDIA 그래픽 드라이버 (중요)

터미널 중간에 뜬 UserWarning: CUDA initialization 메시지가 핵심입니다.

증상: 현재 설치된 NVIDIA 그래픽 드라이버 버전(9010)이 너무 오래되어, Applio가 그래픽카드(GPU)의 가속 기능을 사용하지 못하고 있습니다.
결과: 이 상태로도 실행은 되지만, AI 음성 변환(Inference)이나 학습(Train) 속도가 매우 느리거나(CPU 모드), 오류가 발생할 수 있습니다.
해결책: NVIDIA 공식 홈페이지에 접속하여 본인의 그래픽카드 모델에 맞는 최신 Game Ready 드라이버를 다운로드해 설치하세요.
필자가 사용하는 PC 의 엔비디아 그래픽 카드인 705 모델이 너무 후져서 드러이버 업그레이드를 실시했으나 아무런 도움이 되질 않아 설정 단계에서 GPU 가 아닌 CPU 로 바꾸어 실행하였다. 되기는 하지만 2곡 학습에 14시간 30분이 소요되어 이 방법 추천할 수가 없네요.

10년 이상 오래된 PC 라서 가속용 GPU 가 있을리 만무하지만 그래도 그래픽 카드는 꼽아두었기에 작업관리자에서 확인해보자. GPU0 를 확인하니 NVIDIA GeForce GT 705 모델이었다. 어쨋든 업그레이드 정도는 해봐야겠다.

엔비디아 홈페이지로부터 무척이나 낡은 그래픽 카드 드라이버를 다운받아 업그레이드를 시도하였으나 실망스럽게도 CUDA 지원 GPU 연산에 아무런 쓸모가 없다는 메세지를 받았다. 결국 CPU 모드로 실행을 시켜야 한다는 의미이다.

2월 19일 오후 7시 49분에 학습이 시작되었고 한 시간 동안 기다리다가 지쳐 그대로 두었다가 2월 20일 오후에 다시 열어보니 다음과 같이 2월 20일 오전 10시 29분에 연산이 성공적으로 종료되었음을 알수 있었다. GPU가 없다는 죄로 14시간 43분 심리적 고문을 당했었다. GPU 장사하는 젠슨황이나 GPU 보드 사서 인공지능 작업하는 빅테크들의 고충을 알 것 같다는 생각이 든다.

일단 학습대상이 배호의 노래 2곡이기때문에 14시간으로 끝났지만 10곡 정도 되면 아무래도 달포는 걸릴거로 예상된다.

참고로 2012년 Alexnet 학습시에도 GPU 를 사용하면서도 몇달간 학습시간이 소요되었다는 얘기도 있다. 그래서 학습은 반드시 아래 블로그를 참조하여 구글 Colab 에서 무료 GPU 서비스를 받으면서 Applio.ipynb 를 사용하기 바란다.

Colab에서 Applio로 가수 배호의 노래 목소리 AI Cover 를 만들어 보자.

https://ejleep1.tistory.com/1721

AI Cover 학습 후 얻은 결과물들은 run-applio.bat 파일이 포함된 폴더에 생성된 logs 폴더내에 사용자가 설정한 모델명 여기서는 baho 폴더에 출력된다. 다음의 3개가 바로 학습된 데이터 파일들이며 추론(Inference)단계 즉 목소리 변환에 사용된다.

baho_200e_2800s.pth

D_2333333.pth

G_2333333.pth

추론 단계 작업은 Colab Applio.ipynb 실행 과정에서 사용법을 설명하였는데 이 부분은 Colab 에서나 윈도우즈에서나 거의 동일하다. 단 Colab 에서는 Applio 그래픽 화면을 띄우기 위해서 GPU 접속하여 5분 정도 시간이 소요되어야 학습(Training)이나 추론(Inference) 단계로 들어갈 수 있지만 윈도우즈에서는 금방 그래픽 화면이 뜨므로 막바로 추론 작업이 가능한 이점이 있다.

다음과 같이 윈도우즈 C 드라이버 상 logs 폴더 내에 ... 200e ...pth 학습파일과 baho.index 파일을 지정한 후 오디오 선택 버튼을 눌러 타겟 목소리 파일 Drop 또는 Drag 작업을 실행한다. 학습과정과는 달리 추론 과정은 금방 실행이 끝나는 특징이 있다.

마지막 단계로 변환(Convert) 버튼을 누르면 곧 변환된 wav 파일이 파형과 함께 나타난다.

최종 배호의 목소리로 AI Covert 처리한 조용필의 돌아와요 부산항을 다운 받아 들어보자. 노래 음에 배호 특유의 떨림 내지는 트레몰로가 묻어나 있음을 느낄 수 있을 것이다.

아래는 2곡을 학습한 AI Cover 로 처리한 결과이다.

돌아와요부산항에_output.wav

5.48MB

마지막으로 노래 목소리와 반주 음악을 합하는 믹싱 과정이 남아 있는데 이 부분에 대해서는 Gemini 가 가르쳐준 다음의 내용을 참고하도록 하자.

3단계: 최종 결과물 합치기 (믹싱)

변환된 'AI 목소리'와 1단계에서 얻은 '반주(MR)'를 다시 하나로 합쳐야 노래가 완성됩니다.

Applio 내의 Audio Effects 기능을 사용하거나, Audacity 같은 무료 프로그램을 사용합니다.
배경음(MR) 트랙과 변환된 AI 보컬 트랙을 동시에 올립니다.
목소리 볼륨이 너무 크거나 작지 않게 조절한 뒤, 하나의 파일(MP3/WAV)로 내보내기(Export) 합니다.

인공지능을 이용하여 AI Cover 를 만드는데 성공은 한듯하나 고궐리티 작품 수준으로 격상하기 위해서는 어마어마한 편집 품이 필요하지 않나 싶다.

Under Construction

'인공지능응용: AI Cover' 카테고리의 다른 글

Applio로 가수 배호의 노래목소리 AI Cover 를 만들어 보자 목차 (0)	2026.02.21
Colab Applio 로 가수 배호의 노래 목소리 2개로 AI Cover 를 만들어 보자. (0)	2026.02.20
Gemini 코칭에 따른 노래 목소리 분리 UVR5 윈도우 버전 설치 (0)	2026.02.07
배호 노래가사로부터 텍스트를 출력해보자. (0)	2026.02.06
MP3 노래파일로부터 목소리[Vocal]만을 추출하자. (0)	2026.02.05

현재글윈도우즈 Applio 에서 가수 배호의 목소리 AI Cover 로 트로트를 더빙해보자

Arduio , AI, Quantum Computing Coding

ㅗ았으, 후 실행,

Today :
Yesterday :

Arduio , AI, Quantum Computing Coding