Spaces:

jhtonyKoo
/

ITO-Master

Runtime error

jhtonyKoo commited on Oct 15, 2024

Commit

20161bc

1 Parent(s): acc6615

modify fx norm

Files changed (2) hide show

app.py CHANGED Viewed

@@ -87,6 +87,7 @@ def process_audio(input_audio, reference_audio):
     output_audio = loudness_normalize(output_audio, sr)
     # Denormalize the audio to int16
     output_audio = denormalize_audio(output_audio, dtype=np.int16)
     return (sr, output_audio), param_output, (sr, normalized_input)

     output_audio = loudness_normalize(output_audio, sr)
     # Denormalize the audio to int16
     output_audio = denormalize_audio(output_audio, dtype=np.int16)
+    normalized_input = denormalize_audio(normalized_input, dtype=np.int16)
     return (sr, output_audio), param_output, (sr, normalized_input)

inference.py CHANGED Viewed

@@ -143,9 +143,7 @@ class MasteringStyleTransfer:
         # Apply fx normalization for input audio during mastering style transfer
         if normalize:
-            print(f"before normalization: {data.shape}")
             data = self.fx_normalizer.normalize_audio(data.T, 'mixture').T
-            print(f"after normalization: {data.shape}")
         # Convert to torch tensor
         data_tensor = torch.FloatTensor(data).unsqueeze(0)
@@ -153,11 +151,9 @@ class MasteringStyleTransfer:
         return data_tensor.to(self.device)
     def process_audio(self, input_audio, reference_audio):
-        print(f"input: {input_audio}")
-        print(f"reference: {reference_audio}")
         input_tensor = self.preprocess_audio(input_audio, self.args.sample_rate, normalize=True)
-        print(f"input_tensor: {input_tensor.shape}")
         reference_tensor = self.preprocess_audio(reference_audio, self.args.sample_rate)
         print(f"reference_tensor: {reference_tensor.shape}")
         reference_feature = self.get_reference_embedding(reference_tensor)

         # Apply fx normalization for input audio during mastering style transfer
         if normalize:
             data = self.fx_normalizer.normalize_audio(data.T, 'mixture').T
         # Convert to torch tensor
         data_tensor = torch.FloatTensor(data).unsqueeze(0)
         return data_tensor.to(self.device)
     def process_audio(self, input_audio, reference_audio):
         input_tensor = self.preprocess_audio(input_audio, self.args.sample_rate, normalize=True)
         reference_tensor = self.preprocess_audio(reference_audio, self.args.sample_rate)
+        print(f"input_tensor: {input_tensor.shape}")
         print(f"reference_tensor: {reference_tensor.shape}")
         reference_feature = self.get_reference_embedding(reference_tensor)