From 5d4fdaa93e9c6e1b8d3152903993c85f5c7c0334 Mon Sep 17 00:00:00 2001
From: Jeronymous <jeromelouradour@gmail.com>
Date: Thu, 14 Mar 2024 16:51:41 +0100
Subject: [PATCH] fix VAD timestamp conversion (bug introduced in 1.15.2)

---
 whisper_timestamped/transcribe.py | 6 +++---
 1 file changed, 3 insertions(+), 3 deletions(-)

diff --git a/whisper_timestamped/transcribe.py b/whisper_timestamped/transcribe.py
index 9a14a44..4afbf7e 100644
--- a/whisper_timestamped/transcribe.py
+++ b/whisper_timestamped/transcribe.py
@@ -3,7 +3,7 @@
 __author__ = "Jérôme Louradour"
 __credits__ = ["Jérôme Louradour"]
 __license__ = "GPLv3"
-__version__ = "1.15.2"
+__version__ = "1.15.3"
 
 # Set some environment variables
 import os
@@ -2106,7 +2106,7 @@ def remove_non_speech(audio,
         if avoid_empty_speech:
             segments = [(0, audio.shape[-1])]
         else:
-            return torch.Tensor([]), [], lambda t, t2 = None: do_convert_timestamps(segments, t, t2)
+            return torch.Tensor([]), [], lambda t, t2 = None: t if t2 is None else [t, t2]
 
     audio_speech = torch.cat([audio[..., s:e] for s,e in segments], dim=-1)
 
@@ -2127,7 +2127,7 @@ def remove_non_speech(audio,
     if not use_sample:
         segments = [(float(s)/sample_rate, float(e)/sample_rate) for s,e in segments]
  
-    return audio_speech, segments, lambda t, t2 = None: t if t2 is None else [t, t2]
+    return audio_speech, segments, lambda t, t2 = None: do_convert_timestamps(segments, t, t2)
 
 def do_convert_timestamps(segments, t, t2 = None):
     """