[Speech/PyT] Save two dllogs: .json and .json.X

alancucki · nv-kkudrynski · commit 02e1ccb5825b · 2022-10-04T06:19:59.000-07:00
diff --git a/PyTorch/SpeechRecognition/Jasper/common/tb_dllogger.py b/PyTorch/SpeechRecognition/Jasper/common/tb_dllogger.py
@@ -2,8 +2,9 @@
 import glob
 import os
 import re
-import numpy as np
+from pathlib import Path
 
+import numpy as np
 import torch
 from torch.utils.tensorboard import SummaryWriter
 
@@ -55,17 +56,11 @@ def log_grads(self, step, model):
                                stat=stat)
 
 
-def unique_log_fpath(log_fpath):
-
-    if not os.path.isfile(log_fpath):
-        return log_fpath
-
-    # Avoid overwriting old logs
-    saved = sorted([int(re.search('\.(\d+)', f).group(1))
-                    for f in glob.glob(f'{log_fpath}.*')])
-
-    log_num = (saved[-1] if saved else 0) + 1
-    return f'{log_fpath}.{log_num}'
+def unique_log_fpath(fpath):
+    """Have a unique log filename for every separate run"""
+    log_num = max([0] + [int(re.search("\.(\d+)", Path(f).suffix).group(1))
+                         for f in glob.glob(f"{fpath}.*")])
+    return f"{fpath}.{log_num + 1}"
 
 
 def stdout_step_format(step):
@@ -94,11 +89,12 @@ def init_log(args):
     enabled = (args.local_rank == 0)
     if enabled:
         fpath = args.log_file or os.path.join(args.output_dir, 'nvlog.json')
-        backends = [JSONStreamBackend(Verbosity.DEFAULT,
-                                      unique_log_fpath(fpath)),
-                    StdOutBackend(Verbosity.VERBOSE,
-                                  step_format=stdout_step_format,
-                                  metric_format=stdout_metric_format)]
+        backends = [
+            JSONStreamBackend(Verbosity.DEFAULT, fpath, append=True),
+            JSONStreamBackend(Verbosity.DEFAULT, unique_log_fpath(fpath)),
+            StdOutBackend(Verbosity.VERBOSE, step_format=stdout_step_format,
+                          metric_format=stdout_metric_format)
+        ]
     else:
         backends = []
 
diff --git a/PyTorch/SpeechRecognition/Jasper/inference.py b/PyTorch/SpeechRecognition/Jasper/inference.py
@@ -160,11 +160,11 @@ def main():
     args = parser.parse_args()
 
     log_fpath = args.log_file or str(Path(args.output_dir, 'nvlog_infer.json'))
-    log_fpath = unique_log_fpath(log_fpath)
-    dllogger.init(backends=[JSONStreamBackend(Verbosity.DEFAULT, log_fpath),
-                            StdOutBackend(Verbosity.VERBOSE,
-                                          metric_format=stdout_metric_format)])
-
+    dllogger.init(backends=[
+        JSONStreamBackend(Verbosity.DEFAULT, log_fpath, append=True),
+        JSONStreamBackend(Verbosity.DEFAULT, unique_log_fpath(log_fpath)),
+        StdOutBackend(Verbosity.VERBOSE, metric_format=stdout_metric_format)
+    ])
     [dllogger.log("PARAMETER", {k: v}) for k, v in vars(args).items()]
 
     for step in ['DNN', 'data+DNN', 'data']:
diff --git a/PyTorch/SpeechRecognition/Jasper/requirements.txt b/PyTorch/SpeechRecognition/Jasper/requirements.txt
@@ -7,4 +7,4 @@ pyyaml>=5.4
 soundfile
 sox==1.4.1
 tqdm==4.53.0
-git+https://github.com/NVIDIA/dllogger@v0.1.0#egg=dllogger
+git+https://github.com/NVIDIA/dllogger@v1.0.0#egg=dllogger
diff --git a/PyTorch/SpeechRecognition/QuartzNet/common/tb_dllogger.py b/PyTorch/SpeechRecognition/QuartzNet/common/tb_dllogger.py
@@ -16,8 +16,9 @@
 import glob
 import os
 import re
-import numpy as np
+from pathlib import Path
 
+import numpy as np
 import torch
 from torch.utils.tensorboard import SummaryWriter
 
@@ -69,17 +70,11 @@ def log_grads(self, step, model):
                                stat=stat)
 
 
-def unique_log_fpath(log_fpath):
-
-    if not os.path.isfile(log_fpath):
-        return log_fpath
-
-    # Avoid overwriting old logs
-    saved = sorted([int(re.search('\.(\d+)', f).group(1))
-                    for f in glob.glob(f'{log_fpath}.*')])
-
-    log_num = (saved[-1] if saved else 0) + 1
-    return f'{log_fpath}.{log_num}'
+def unique_log_fpath(fpath):
+    """Have a unique log filename for every separate run"""
+    log_num = max([0] + [int(re.search("\.(\d+)", Path(f).suffix).group(1))
+                         for f in glob.glob(f"{fpath}.*")])
+    return f"{fpath}.{log_num + 1}"
 
 
 def stdout_step_format(step):
@@ -108,11 +103,12 @@ def init_log(args):
     enabled = (args.local_rank == 0)
     if enabled:
         fpath = args.log_file or os.path.join(args.output_dir, 'nvlog.json')
-        backends = [JSONStreamBackend(Verbosity.DEFAULT,
-                                      unique_log_fpath(fpath)),
-                    StdOutBackend(Verbosity.VERBOSE,
-                                  step_format=stdout_step_format,
-                                  metric_format=stdout_metric_format)]
+        backends = [
+            JSONStreamBackend(Verbosity.DEFAULT, fpath, append=True),
+            JSONStreamBackend(Verbosity.DEFAULT, unique_log_fpath(fpath)),
+            StdOutBackend(Verbosity.VERBOSE, step_format=stdout_step_format,
+                          metric_format=stdout_metric_format)
+        ]
     else:
         backends = []
 
diff --git a/PyTorch/SpeechRecognition/QuartzNet/inference.py b/PyTorch/SpeechRecognition/QuartzNet/inference.py
@@ -155,11 +155,11 @@ def main():
     args = parser.parse_args()
 
     log_fpath = args.log_file or str(Path(args.output_dir, 'nvlog_infer.json'))
-    log_fpath = unique_log_fpath(log_fpath)
-    dllogger.init(backends=[JSONStreamBackend(Verbosity.DEFAULT, log_fpath),
-                            StdOutBackend(Verbosity.VERBOSE,
-                                          metric_format=stdout_metric_format)])
-
+    dllogger.init(backends=[
+        JSONStreamBackend(Verbosity.DEFAULT, log_fpath, append=True),
+        JSONStreamBackend(Verbosity.DEFAULT, unique_log_fpath(log_fpath)),
+        StdOutBackend(Verbosity.VERBOSE, metric_format=stdout_metric_format)
+    ])
     [dllogger.log("PARAMETER", {k: v}) for k, v in vars(args).items()]
 
     for step in ['DNN', 'data+DNN', 'data']:
diff --git a/PyTorch/SpeechRecognition/QuartzNet/requirements.txt b/PyTorch/SpeechRecognition/QuartzNet/requirements.txt
@@ -7,4 +7,4 @@ pyyaml>=5.4
 soundfile
 sox==1.4.1
 tqdm==4.53.0
-git+https://github.com/NVIDIA/dllogger@v0.1.0#egg=dllogger
+git+https://github.com/NVIDIA/dllogger@v1.0.0#egg=dllogger
diff --git a/PyTorch/SpeechSynthesis/FastPitch/common/tb_dllogger.py b/PyTorch/SpeechSynthesis/FastPitch/common/tb_dllogger.py
@@ -55,14 +55,10 @@ def log_grads(self, step, model):
 
 
 def unique_log_fpath(fpath):
-
-    if not Path(fpath).is_file():
-        return fpath
-
-    # Avoid overwriting old logs
-    saved = [re.search('\.(\d+)$', f) for f in glob.glob(f'{fpath}.*')]
-    saved = [0] + [int(m.group(1)) for m in saved if m is not None]
-    return f'{fpath}.{max(saved) + 1}'
+    """Have a unique log filename for every separate run"""
+    log_num = max([0] + [int(re.search("\.(\d+)", Path(f).suffix).group(1))
+                         for f in glob.glob(f"{fpath}.*")])
+    return f"{fpath}.{log_num + 1}"
 
 
 def stdout_step_format(step):
@@ -90,11 +86,12 @@ def stdout_metric_format(metric, metadata, value):
 def init(log_fpath, log_dir, enabled=True, tb_subsets=[], **tb_kw):
 
     if enabled:
-        backends = [JSONStreamBackend(Verbosity.DEFAULT,
-                                      unique_log_fpath(log_fpath)),
-                    StdOutBackend(Verbosity.VERBOSE,
-                                  step_format=stdout_step_format,
-                                  metric_format=stdout_metric_format)]
+        backends = [
+            JSONStreamBackend(Verbosity.DEFAULT, log_fpath, append=True),
+            JSONStreamBackend(Verbosity.DEFAULT, unique_log_fpath(log_fpath)),
+            StdOutBackend(Verbosity.VERBOSE, step_format=stdout_step_format,
+                          metric_format=stdout_metric_format)
+        ]
     else:
         backends = []
 
diff --git a/PyTorch/SpeechSynthesis/FastPitch/inference.py b/PyTorch/SpeechSynthesis/FastPitch/inference.py
@@ -310,12 +310,11 @@ def main():
         Path(args.output).mkdir(parents=False, exist_ok=True)
 
     log_fpath = args.log_file or str(Path(args.output, 'nvlog_infer.json'))
-    log_fpath = unique_log_fpath(log_fpath)
-    DLLogger.init(backends=[JSONStreamBackend(Verbosity.DEFAULT, log_fpath),
-                            StdOutBackend(Verbosity.VERBOSE,
-                                          metric_format=stdout_metric_format)
-                            ])
-
+    DLLogger.init(backends=[
+        JSONStreamBackend(Verbosity.DEFAULT, log_fpath, append=True),
+        JSONStreamBackend(Verbosity.DEFAULT, unique_log_fpath(log_fpath)),
+        StdOutBackend(Verbosity.VERBOSE, metric_format=stdout_metric_format)
+    ])
     init_inference_metadata(args.batch_size)
     [DLLogger.log("PARAMETER", {k: v}) for k, v in vars(args).items()]
 
diff --git a/PyTorch/SpeechSynthesis/FastPitch/requirements.txt b/PyTorch/SpeechSynthesis/FastPitch/requirements.txt
@@ -1,8 +1,8 @@
-git+https://github.com/NVIDIA/dllogger#egg=dllogger
 inflect
 librosa==0.9.0
 matplotlib
 numpy
 pynvml==11.0.0
 scipy
 tensorboardX==2.0
+git+https://github.com/NVIDIA/dllogger@v1.0.0#egg=dllogger
diff --git a/PyTorch/SpeechSynthesis/HiFi-GAN/common/tb_dllogger.py b/PyTorch/SpeechSynthesis/HiFi-GAN/common/tb_dllogger.py
@@ -80,14 +80,10 @@ def log_samples(self, step, sample_ind, audio, spec, rate):
 
 
 def unique_log_fpath(fpath):
-
-    if not Path(fpath).is_file():
-        return fpath
-
-    # Avoid overwriting old logs
-    saved = [re.search('\.(\d+)$', f) for f in glob.glob(f'{fpath}.*')]
-    saved = [0] + [int(m.group(1)) for m in saved if m is not None]
-    return f'{fpath}.{max(saved) + 1}'
+    """Have a unique log filename for every separate run"""
+    log_num = max([0] + [int(re.search("\.(\d+)", Path(f).suffix).group(1))
+                         for f in glob.glob(f"{fpath}.*")])
+    return f"{fpath}.{log_num + 1}"
 
 
 def stdout_step_format(step):
diff --git a/PyTorch/SpeechSynthesis/HiFi-GAN/hifigan/logging.py b/PyTorch/SpeechSynthesis/HiFi-GAN/hifigan/logging.py
@@ -33,17 +33,16 @@ def init_logger(output_dir, log_file, ema_decay=0.0):
 
     local_rank = 0 if not dist.is_initialized() else dist.get_rank()
 
-    print('logger init', local_rank)
-
     if local_rank == 0:
         Path(output_dir).mkdir(parents=False, exist_ok=True)
         log_fpath = log_file or Path(output_dir, 'nvlog.json')
 
         dllogger.init(backends=[
+            JSONStreamBackend(Verbosity.DEFAULT, log_fpath, append=True),
             JSONStreamBackend(Verbosity.DEFAULT, unique_log_fpath(log_fpath)),
             StdOutBackend(Verbosity.VERBOSE, step_format=stdout_step_format,
-                          metric_format=stdout_metric_format)])
-
+                          metric_format=stdout_metric_format)
+        ])
         init_train_metadata()
     else:
         dllogger.init(backends=[])
diff --git a/PyTorch/SpeechSynthesis/HiFi-GAN/inference.py b/PyTorch/SpeechSynthesis/HiFi-GAN/inference.py
@@ -311,12 +311,11 @@ def main():
         Path(args.output).mkdir(parents=False, exist_ok=True)
 
     log_fpath = args.log_file or str(Path(args.output, 'nvlog_infer.json'))
-    log_fpath = unique_log_fpath(log_fpath)
-    DLLogger.init(backends=[JSONStreamBackend(Verbosity.DEFAULT, log_fpath),
-                            StdOutBackend(Verbosity.VERBOSE,
-                                          metric_format=stdout_metric_format)
-                            ])
-
+    DLLogger.init(backends=[
+        JSONStreamBackend(Verbosity.DEFAULT, log_fpath, append=True),
+        JSONStreamBackend(Verbosity.DEFAULT, unique_log_fpath(log_fpath)),
+        StdOutBackend(Verbosity.VERBOSE, metric_format=stdout_metric_format)
+    ])
     init_inference_metadata(args.batch_size)
     [DLLogger.log("PARAMETER", {k: v}) for k, v in vars(args).items()]
 
diff --git a/PyTorch/SpeechSynthesis/HiFi-GAN/requirements.txt b/PyTorch/SpeechSynthesis/HiFi-GAN/requirements.txt
@@ -1,4 +1,3 @@
-git+https://github.com/NVIDIA/dllogger#egg=dllogger
 inflect
 librosa==0.9.0
 numpy
@@ -7,3 +6,4 @@ pynvml==11.0.0
 pysoundfile
 scipy
 tensorboardX==2.0
+git+https://github.com/NVIDIA/dllogger@v1.0.0#egg=dllogger