Spaces:

ahsanMah
/

localizing-anomalies

Running

App Files Files Community

ahsanMah commited on Jun 20, 2024

Commit

bf573cf

1 Parent(s): b1602ac

+ added cmd line to msma

Browse files

Files changed (2) hide show

app.py +33 -13
msma.py +44 -18

app.py CHANGED Viewed

@@ -6,12 +6,14 @@ import matplotlib.pyplot as plt
 import numpy as np
 import torch
-from msma import build_model, config_presets
 @cache
-def load_model(preset="edm2-img64-s-fid", device='cpu'):
-    return build_model(preset, device)
 @cache
 def load_reference_scores(model_dir):
@@ -38,24 +40,42 @@ def plot_against_reference(nll, ref_nll):
     return fig
-def run_inference(img, preset="edm2-img64-s-fid", device="cuda"):
-    img = torch.from_numpy(img).permute(2,0,1).unsqueeze(0)
-    img = torch.nn.functional.interpolate(img, size=64, mode='bilinear')
-    model = load_model(preset=preset, device=device)
-    x = model(img.cuda())
-    x = x.square().sum(dim=(2, 3, 4)) ** 0.5
-    nll, pct, ref_nll = compute_gmm_likelihood(x.cpu(), model_dir=f"models/{preset}")
-    plot = plot_against_reference(nll, ref_nll)
     outstr = f"Anomaly score: {nll:.3f} / {pct:.2f} percentile"
-    return outstr, plot
 demo = gr.Interface(
     fn=run_inference,
     inputs=["image"],
-    outputs=["text", gr.Plot(label="Comparing to Imagenette")],
 )
 if __name__ == "__main__":

 import numpy as np
 import torch
+from msma import ScoreFlow, config_presets
 @cache
+def load_model(modeldir, preset="edm2-img64-s-fid", device='cpu', outdir=None):
+    model = ScoreFlow(preset, device=device)
+    model.flow.load_state_dict(torch.load(f"{modeldir}/{preset}/flow.pt"))
+    return model
 @cache
 def load_reference_scores(model_dir):
     return fig
+def plot_heatmap(heatmap):
+    fig, ax = plt.subplots()
+    im = heatmap[0,0]
+    ax.imshow(im, cmap='gist_heat')
+    fig.tight_layout()
+    return fig
+# def compute_scores
+def run_inference(img, preset="edm2-img64-s-fid", device="cuda"):
+    with torch.inference_mode():
+        img = torch.from_numpy(img).permute(2,0,1).unsqueeze(0)
+        img = torch.nn.functional.interpolate(img, size=64, mode='bilinear')
+        img = img.to(device)
+        model = load_model(modeldir='models', preset=preset, device=device)
+        x = model.scorenet(img)
+        x = x.square().sum(dim=(2, 3, 4)) ** 0.5
+        img_likelihood = model(img).cpu().numpy()
+        nll, pct, ref_nll = compute_gmm_likelihood(x.cpu(), model_dir=f"models/{preset}")
     outstr = f"Anomaly score: {nll:.3f} / {pct:.2f} percentile"
+    histplot = plot_against_reference(nll, ref_nll)
+    heatmapplot = plot_heatmap(img_likelihood)
+    return outstr, heatmapplot, histplot
 demo = gr.Interface(
     fn=run_inference,
     inputs=["image"],
+    outputs=["text",
+             gr.Plot(label="Anomaly Heatmap"),
+             gr.Plot(label="Comparing to Imagenette"),
+            ],
 )
 if __name__ == "__main__":

msma.py CHANGED Viewed

@@ -3,6 +3,7 @@ import pickle
 from functools import partial
 from pickle import dump, load
 import numpy as np
 import PIL.Image
 import torch
@@ -95,12 +96,12 @@ class EDMScorer(torch.nn.Module):
 class ScoreFlow(torch.nn.Module):
     def __init__(
         self,
-        scorenet,
-        vectorize=False,
         device="cpu",
     ):
         super().__init__()
         h = w = scorenet.net.img_resolution
         c = scorenet.net.img_channels
         num_sigmas = len(scorenet.sigma_steps)
@@ -134,9 +135,9 @@ def train_gmm(score_path, outdir, grid_search=False):
     gm = GaussianMixture(
         n_components=7, init_params="kmeans", covariance_type="full", max_iter=100000
     )
     if grid_search:
-        clf = Pipeline([("scaler", StandardScaler()), ("GMM", gm)])
         param_grid = dict(
             GMM__n_components=range(2, 11, 1),
         )
@@ -184,10 +185,11 @@ def compute_gmm_likelihood(x_score, gmmdir):
     return nll, percentile
-def cache_score_norms(preset, dataset_path, device="cpu"):
     dsobj = ImageFolderDataset(path=dataset_path, resolution=64)
     refimg, reflabel = dsobj[0]
-    print(refimg.shape, refimg.dtype, reflabel)
     dsloader = torch.utils.data.DataLoader(
         dsobj, batch_size=48, num_workers=4, prefetch_factor=2
     )
@@ -202,8 +204,8 @@ def cache_score_norms(preset, dataset_path, device="cpu"):
     score_norms = torch.cat(score_norms, dim=0)
-    os.makedirs("out/msma", exist_ok=True)
-    with open(f"out/msma/{preset}_imagenette_score_norms.pt", "wb") as f:
         torch.save(score_norms, f)
     print(f"Computed score norms for {score_norms.shape[0]} samples")
@@ -232,7 +234,7 @@ def train_flow(dataset_path, preset, device="cuda"):
         val_ds, batch_size=48, num_workers=4, prefetch_factor=2
     )
-    model = ScoreFlow(build_model(preset=preset), device=device)
     opt = torch.optim.AdamW(model.flow.parameters(), lr=3e-4, weight_decay=1e-5)
     train_step = partial(
         PatchFlow.stochastic_step,
@@ -296,16 +298,15 @@ def test_runner(device="cpu"):
     return scores
-def test_flow_runner(device="cpu", load_weights=None):
-    f = "doge.jpg"
-    # f = "goldfish.JPEG"
     image = (PIL.Image.open(f)).resize((64, 64), PIL.Image.Resampling.LANCZOS)
     image = np.array(image)
     image = image.reshape(*image.shape[:2], -1).transpose(2, 0, 1)
     x = torch.from_numpy(image).unsqueeze(0).to(device)
-    model = build_model(device=device)
-    score_flow = ScoreFlow(scorenet=model, device=device)
     if load_weights is not None:
         score_flow.flow.load_state_dict(torch.load(load_weights))
@@ -323,13 +324,35 @@ def test_flow_runner(device="cpu", load_weights=None):
     return
-if __name__ == "__main__":
     device = "cuda" if torch.cuda.is_available() else "cpu"
-    preset = "edm2-img64-s-fid"
-    imagenette_path = "/GROND_STOR/amahmood/datasets/img64/"
-    train_flow(imagenette_path, preset, device)
-    test_flow_runner("cuda", f"out/msma/{preset}/flow.pt")
     # cache_score_norms(
     #     preset=preset,
@@ -344,3 +367,6 @@ if __name__ == "__main__":
     # s = s.to("cpu").numpy()
     # nll, pct = compute_gmm_likelihood(s, gmmdir=f"out/msma/{preset}/")
     # print(f"Anomaly score for image: {nll[0]:.3f} @ {pct*100:.2f} percentile")

 from functools import partial
 from pickle import dump, load
+import click
 import numpy as np
 import PIL.Image
 import torch
 class ScoreFlow(torch.nn.Module):
     def __init__(
         self,
+        preset,
         device="cpu",
     ):
         super().__init__()
+        scorenet = build_model(preset)
         h = w = scorenet.net.img_resolution
         c = scorenet.net.img_channels
         num_sigmas = len(scorenet.sigma_steps)
     gm = GaussianMixture(
         n_components=7, init_params="kmeans", covariance_type="full", max_iter=100000
     )
+    clf = Pipeline([("scaler", StandardScaler()), ("GMM", gm)])
     if grid_search:
         param_grid = dict(
             GMM__n_components=range(2, 11, 1),
         )
     return nll, percentile
+def cache_score_norms(preset, dataset_path, outdir, device="cpu"):
     dsobj = ImageFolderDataset(path=dataset_path, resolution=64)
     refimg, reflabel = dsobj[0]
+    print(f"Loading dataset from {dataset_path}")
+    print(f"Number of Samples: {len(dsobj)} - shape: {refimg.shape}, dtype: {refimg.dtype}, labels {reflabel}")
     dsloader = torch.utils.data.DataLoader(
         dsobj, batch_size=48, num_workers=4, prefetch_factor=2
     )
     score_norms = torch.cat(score_norms, dim=0)
+    os.makedirs(f"{outdir}/{preset}/", exist_ok=True)
+    with open(f"{outdir}/{preset}/imagenette_score_norms.pt", "wb") as f:
         torch.save(score_norms, f)
     print(f"Computed score norms for {score_norms.shape[0]} samples")
         val_ds, batch_size=48, num_workers=4, prefetch_factor=2
     )
+    model = ScoreFlow(preset, device=device)
     opt = torch.optim.AdamW(model.flow.parameters(), lr=3e-4, weight_decay=1e-5)
     train_step = partial(
         PatchFlow.stochastic_step,
     return scores
+def test_flow_runner(preset, device="cpu", load_weights=None):
+    # f = "doge.jpg"
+    f = "goldfish.JPEG"
     image = (PIL.Image.open(f)).resize((64, 64), PIL.Image.Resampling.LANCZOS)
     image = np.array(image)
     image = image.reshape(*image.shape[:2], -1).transpose(2, 0, 1)
     x = torch.from_numpy(image).unsqueeze(0).to(device)
+    score_flow = ScoreFlow(preset, device=device)
     if load_weights is not None:
         score_flow.flow.load_state_dict(torch.load(load_weights))
     return
+@click.command()
+# Main options.
+@click.option('--run',             help='Which function to run',
+              type=click.Choice(['cache-scores', 'train-flow', 'train-gmm'], case_sensitive=False)
+)
+@click.option('--outdir',           help='Where to load/save the results', metavar='DIR',            type=str, required=True)
+@click.option('--preset',           help='Configuration preset', metavar='STR',                 type=str, default='edm2-img64-s-fid', show_default=True)
+@click.option('--data',             help='Path to the dataset', metavar='ZIP|DIR',              type=str, default=None)
+def cmdline(run, outdir, **opts):
     device = "cuda" if torch.cuda.is_available() else "cpu"
+    preset = opts['preset']
+    dataset_path = opts['data']
+    if run in ['cache-scores', 'train-flow']:
+        assert opts['data'] is not None, "Provide path to dataset"
+    if run == "cache-scores":
+        cache_score_norms(preset=preset, dataset_path=dataset_path, outdir=outdir, device=device)
+    if run == "train-gmm":
+        train_gmm(
+            score_path=f"{outdir}/{preset}/imagenette_score_norms.pt",
+            outdir=f"{outdir}/{preset}",
+            grid_search=True,
+        )
+    # test_flow_runner("cuda", f"out/msma/{preset}/flow.pt")
+    # train_flow(imagenette_path, preset, device)
     # cache_score_norms(
     #     preset=preset,
     # s = s.to("cpu").numpy()
     # nll, pct = compute_gmm_likelihood(s, gmmdir=f"out/msma/{preset}/")
     # print(f"Anomaly score for image: {nll[0]:.3f} @ {pct*100:.2f} percentile")
+if __name__ == "__main__":
+    cmdline()