Oddziel wokale od MP3 dzięki temu darmowemu oprogramowaniu opartemu na sztucznej inteligencji

Udostępnij w sieciach społecznościowych:

Spleeter jest bezpłatne narzędzie wiersza poleceń do dzielenia głosu z MP3 za pomocą uczenia maszynowego. Wykorzystuje wstępnie przeszkolone sieci neuronowe i analizuje dany plik audio. Generuje dwa pliki WAV na wyjściu; jeden plik zawiera wokal wyodrębniony z audio, a następnie inny plik WAV zawiera tylko muzykę. Dokładność tego narzędzia nie jest w 100 procentach na każdym pliku audio, ale jest niesamowita. Może precyzyjnie wykrywać sygnały w pliku audio, które są wokalem lub innymi instrumentami i dokładnie je wyodrębnia. Jest jedno polecenie, które musisz wykonać na swoim terminalu, a następnie zajmie się resztą. To oprogramowanie jest napisane w języku Python i będziesz potrzebować Anacondy na komputerze lub VPS, aby z niego korzystać.

Proces oddzielania wokalu od utworu lub pliku MP3 nazywa się „Blind Source Separation”. W tej technice różne sygnały w źródłowym dźwięku są identyfikowane, a następnie rozdzielane. Istnieje długa ręczna metoda robienia tego samego za pomocą oprogramowania do przetwarzania dźwięku. Ale tutaj możesz to zrobić, uruchamiając jedno polecenie. Narzędzie wykorzystuje tutaj wstępnie wyszkolone sieci neuronowe, a następnie precyzyjnie wydobywa z nich wokale. Nie tylko wokal, ale można go używać do wydobywania bębnów, basów, fortepianów ze źródłowego pliku audio.

Jak oddzielić wokal od MP3 za pomocą tego darmowego oprogramowania opartego na sztucznej inteligencji?

Tutaj zakładam, że masz zainstalowaną Anacondę na swoim komputerze. Jeśli jeszcze go nie masz, możesz łatwo zainstalować go tutaj. Następnie możesz otworzyć terminal i rozpocząć proces pobierania. Tutaj musisz sklonować repozytorium, a następnie możesz po prostu rozpocząć proces ustawiania. Użyj następującego polecenia, aby sklonować repozytorium Spleeter z GitHub, a następnie możesz po prostu rozpocząć proces konfiguracji.

git clone https://github.com/Deezer/spleeter

klon spiteter git

Uruchom te polecenia jeden po drugim, a wtedy wszystko będzie gotowe do użycia Spleeter. Wykonanie tych poleceń zajmie kilka minut, a podczas procesu konfiguracji potrzebujesz małego pacjenta.

Zobacz:   Nagrywaj dźwięk z gry wewnętrznej na Androida dzięki tej bezpłatnej aplikacji

conda env create -f spleeter/conda/spleeter-cpu.yaml
conda activate spleeter-cpu

conda env

W tym momencie wszyscy jesteście gotowi używać tego narzędzia do procesu separacji. Możesz zachować plik audio w sklonowanym katalogu Spleeter. W repozytorium znajduje się nawet przykładowy plik audio. Jeśli chcesz tylko sprawdzić, jak to działa, możesz użyć przykładowego pliku audio. Aby użyć tego oprogramowania do oddzielenia głosu od podanego pliku audio, uruchom następujące polecenie.

spleeter separate -i spleeter/audio_file -p spleeter:2stems -o output

śledzia w akcji

Po zakończeniu powyższego polecenia w folderze wyjściowym znajdziesz dwa pliki WAV. Jeden plik zawiera tylko dźwięk, a drugi zawiera wydobyte wokale. Możesz wtedy usłyszeć i sprawdzić, czy ekstrakcja zakończyła się powodzeniem. Później możesz zobaczyć zaawansowany przewodnik użytkowania na stronie GitHub tego narzędzia, a następnie odpowiednio go użyć.

wyniki śledziony

W ten sposób używasz tego narzędzia do oddzielania wokalu od piosenki za pomocą sztucznej inteligencji. Możesz przejrzeć całą dokumentację tego narzędzia i zobaczyć inne zaawansowane zastosowania. Istnieje kilka innych modeli, które można pobrać i wykorzystać do szybszego procesu separacji. Działa dobrze na procesorze, ale na GPU działa szybciej.

Końcowe przemyślenia

Wydobywanie głosu z pliku audio jest bardzo trudnym procesem, jeśli robisz to ręcznie. Istnieje kilka płatnych narzędzi, których można użyć do tego samego, ale to, o którym tu wspomniałem, wykorzystuje uczenie maszynowe do wykonania pracy. Najlepsze jest to, że jest darmowy i jestem bardzo zadowolony z produkowanych efektów. Teraz możesz sprawdzić, czy Ci się uda. Po prostu chwyć go i wykonaj wyżej wymienione kroki.

Komentarze Facebook