dilyabareeva · gumityolcu · Aug 9, 2024 · Aug 12, 2024 · Aug 13, 2024 · Aug 13, 2024
diff --git a/pyproject.toml b/pyproject.toml
@@ -13,11 +13,13 @@ dependencies = [
     "lightning>=1.4.0",
     "torchmetrics>=1.4.0",
     "tqdm>=4.0.0",
+    "traker>=0.3.2"
 ]
 dynamic = ["version"]
 
 [tool.isort]
 profile = "black"
+extend_skip = ["__init__.py"]
 line_length = 79
 multi_line_output = 3
 include_trailing_comma = true
@@ -29,6 +31,10 @@ warn_unused_configs = true
 check_untyped_defs = true
 #ignore_errors = true # TODO: change this
 
+[[tool.mypy.overrides]]
+module = ["trak", "trak.projectors", "fast_jl"]
+ignore_missing_imports = true
+
 # Black formatting
 [tool.black]
 line-length = 127

diff --git a/quanda/explainers/__init__.py b/quanda/explainers/__init__.py
@@ -1,11 +1,11 @@
+from quanda.explainers.base import BaseExplainer
 from quanda.explainers import utils, wrappers
 from quanda.explainers.aggregators import (
     AbsSumAggregator,
     BaseAggregator,
     SumAggregator,
     aggr_types,
 )
-from quanda.explainers.base import BaseExplainer
 from quanda.explainers.functional import ExplainFunc, ExplainFuncMini
 from quanda.explainers.random import RandomExplainer
 

diff --git a/quanda/explainers/wrappers/__init__.py b/quanda/explainers/wrappers/__init__.py
@@ -11,6 +11,8 @@
     captum_tracincp_self_influence,
 )
 
+from quanda.explainers.wrappers.trak_wrapper import TRAK, trak_explain, trak_self_influence
+
 __all__ = [
     "CaptumInfluence",
     "CaptumSimilarity",
@@ -22,4 +24,7 @@
     "CaptumTracInCP",
     "captum_tracincp_explain",
     "captum_tracincp_self_influence",
+    "TRAK",
+    "trak_explain",
+    "trak_self_influence",
 ]
diff --git a/quanda/explainers/wrappers/captum_influence.py b/quanda/explainers/wrappers/captum_influence.py
@@ -11,7 +11,7 @@
     ArnoldiInfluenceFunction,
 )
 
-from quanda.explainers.base import BaseExplainer
+from quanda.explainers import BaseExplainer
 from quanda.explainers.utils import (
     explain_fn_from_explainer,
     self_influence_fn_from_explainer,

diff --git a/quanda/explainers/wrappers/trak_wrapper.py b/quanda/explainers/wrappers/trak_wrapper.py
@@ -0,0 +1,171 @@
+import warnings
+from typing import Any, Iterable, List, Literal, Optional, Sized, Union
+
+import torch
+from trak import TRAKer
+from trak.projectors import BasicProjector, CudaProjector, NoOpProjector
+
+from quanda.explainers import BaseExplainer
+from quanda.explainers.utils import (
+    explain_fn_from_explainer,
+    self_influence_fn_from_explainer,
+)
+
+TRAKProjectorLiteral = Literal["cuda", "noop", "basic", "check_cuda"]
+TRAKProjectionTypeLiteral = Literal["rademacher", "normal"]
+
+
+class TRAK(BaseExplainer):
+    def __init__(
+        self,
+        model: torch.nn.Module,
+        train_dataset: torch.utils.data.Dataset,
+        model_id: str,
+        cache_dir: Optional[str] = None,
+        device: Union[str, torch.device] = "cpu",
+        projector: TRAKProjectorLiteral = "check_cuda",
+        proj_dim: int = 128,
+        proj_type: TRAKProjectionTypeLiteral = "normal",
+        seed: int = 42,
+        batch_size: int = 32,
+        params_ldr: Optional[Iterable] = None,
+    ):
+        super(TRAK, self).__init__(
+            model=model, train_dataset=train_dataset, model_id=model_id, cache_dir=cache_dir, device=device
+        )
+        self.dataset = train_dataset
+        self.proj_dim = proj_dim
+        self.batch_size = batch_size
+        self.cache_dir = cache_dir if cache_dir is not None else f"./trak_{model_id}_cache"
+
+        num_params_for_grad = 0
+        params_iter = params_ldr if params_ldr is not None else self.model.parameters()
+        for p in list(params_iter):
+            nn = 1
+            for s in list(p.size()):
+                nn = nn * s
+            num_params_for_grad += nn
+
+        # Check if traker was installer with the ["cuda"] option
+        if projector in ["cuda", "check_cuda"]:
+            try:
+                import fast_jl
+
+                test_gradient = torch.ones(1, num_params_for_grad).cuda()
+                num_sms = torch.cuda.get_device_properties("cuda").multi_processor_count
+                fast_jl.project_rademacher_8(test_gradient, self.proj_dim, 0, num_sms)
+                projector = "cuda"
+            except (ImportError, RuntimeError, AttributeError) as e:
+                warnings.warn(f"Could not use CudaProjector.\nReason: {str(e)}")
+                warnings.warn("Defaulting to BasicProjector.")
+                projector = "basic"
+
+        projector_cls = {
+            "cuda": CudaProjector,
+            "basic": BasicProjector,
+            "noop": NoOpProjector,
+        }
+
+        projector_kwargs = {
+            "grad_dim": num_params_for_grad,
+            "proj_dim": proj_dim,
+            "proj_type": proj_type,
+            "seed": seed,
+            "device": device,
+        }
+        if projector == "cuda":
+            projector_kwargs["max_batch_size"] = self.batch_size
+        projector_obj = projector_cls[projector](**projector_kwargs)
+        self.traker = TRAKer(
+            model=model,
+            task="image_classification",
+            train_set_size=self.dataset_length,
+            projector=projector_obj,
+            proj_dim=proj_dim,
+            projector_seed=seed,
+            save_dir=self.cache_dir,
+            device=device,
+            use_half_precision=False,
+        )
+
+        # Train the TRAK explainer: featurize the training data
+        ld = torch.utils.data.DataLoader(self.dataset, batch_size=self.batch_size)
+        self.traker.load_checkpoint(self.model.state_dict(), model_id=0)
+        for i, (x, y) in enumerate(iter(ld)):
+            batch = x.to(self.device), y.to(self.device)
+            self.traker.featurize(batch=batch, inds=torch.tensor([i * self.batch_size + j for j in range(x.shape[0])]))
+        self.traker.finalize_features()
+        if projector == "basic":
+            # finalize_features frees memory so projector.proj_matrix needs to be reconstructed
+            self.traker.projector = projector_cls[projector](**projector_kwargs)
+
+    @property
+    def dataset_length(self) -> int:
+        """
+        By default, the Dataset class does not always have a __len__ method.
+        :return:
+        """
+        if isinstance(self.dataset, Sized):
+            return len(self.dataset)
+        dl = torch.utils.data.DataLoader(self.dataset, batch_size=1)
+        return len(dl)
+
+    def explain(self, test, targets):
+        test = test.to(self.device)
+        self.traker.start_scoring_checkpoint(
+            model_id=0, checkpoint=self.model.state_dict(), exp_name="test", num_targets=test.shape[0]
+        )
+        self.traker.score(batch=(test, targets), num_samples=test.shape[0])
+        explanations = torch.from_numpy(self.traker.finalize_scores(exp_name="test")).T.to(self.device)
+
+        # os.remove(os.path.join(self.cache_dir, "scores", "test.mmap"))
+        # os.removedirs(os.path.join(self.cache_dir, "scores"))
+
+        return explanations
+
+
+def trak_explain(
+    model: torch.nn.Module,
+    model_id: str,
+    cache_dir: Optional[str],
+    test_tensor: torch.Tensor,
+    train_dataset: torch.utils.data.Dataset,
+    device: Union[str, torch.device],
+    explanation_targets: Optional[Union[List[int], torch.Tensor]] = None,
+    **kwargs: Any,
+) -> torch.Tensor:
+    return explain_fn_from_explainer(
+        explainer_cls=TRAK,
+        model=model,
+        model_id=model_id,
+        cache_dir=cache_dir,
+        test_tensor=test_tensor,
+        targets=explanation_targets,
+        train_dataset=train_dataset,
+        device=device,
+        **kwargs,
+    )
+
+
+def trak_self_influence(
+    model: torch.nn.Module,
+    model_id: str,
+    cache_dir: Optional[str],
+    train_dataset: torch.utils.data.Dataset,
+    device: Union[str, torch.device],
+    batch_size: Optional[int] = 32,
+    **kwargs: Any,
+) -> torch.Tensor:
+    self_influence_kwargs = {
+        "batch_size": batch_size,
+    }
+    return self_influence_fn_from_explainer(
+        explainer_cls=TRAK,
+        model=model,
+        model_id=model_id,
+        cache_dir=cache_dir,
+        train_dataset=train_dataset,
+        device=device,
+        self_influence_kwargs=self_influence_kwargs,
+        **kwargs,
+    )
diff --git a/quanda/metrics/__init__.py b/quanda/metrics/__init__.py
@@ -1,9 +1,9 @@
+from quanda.metrics.base import GlobalMetric, Metric
 from quanda.metrics import localization, randomization, unnamed
 from quanda.metrics.aggr_strategies import (
     GlobalAggrStrategy,
     GlobalSelfInfluenceStrategy,
 )
-from quanda.metrics.base import GlobalMetric, Metric
 
 __all__ = [
     "Metric",

diff --git a/quanda/metrics/localization/class_detection.py b/quanda/metrics/localization/class_detection.py
@@ -2,7 +2,7 @@
 
 import torch
 
-from quanda.metrics.base import Metric
+from quanda.metrics import Metric
 
 
 class ClassDetectionMetric(Metric):

diff --git a/quanda/metrics/localization/mislabeling_detection.py b/quanda/metrics/localization/mislabeling_detection.py
@@ -2,7 +2,7 @@
 
 import torch
 
-from quanda.metrics.base import GlobalMetric
+from quanda.metrics import GlobalMetric
 
 
 class MislabelingDetectionMetric(GlobalMetric):

diff --git a/quanda/metrics/randomization/model_randomization.py b/quanda/metrics/randomization/model_randomization.py
@@ -3,7 +3,7 @@
 
 import torch
 
-from quanda.metrics.base import Metric
+from quanda.metrics import Metric
 from quanda.utils.common import get_parent_module_from_name
 from quanda.utils.functions import CorrelationFnLiterals, correlation_functions
 

diff --git a/quanda/metrics/unnamed/dataset_cleaning.py b/quanda/metrics/unnamed/dataset_cleaning.py
@@ -4,7 +4,7 @@
 import lightning as L
 import torch
 
-from quanda.metrics.base import GlobalMetric
+from quanda.metrics import GlobalMetric
 from quanda.utils.common import class_accuracy
 from quanda.utils.training import BaseTrainer
 

diff --git a/quanda/metrics/unnamed/top_k_overlap.py b/quanda/metrics/unnamed/top_k_overlap.py
@@ -1,6 +1,6 @@
 import torch
 
-from quanda.metrics.base import Metric
+from quanda.metrics import Metric
 
 
 class TopKOverlapMetric(Metric):

diff --git a/quanda/toy_benchmarks/__init__.py b/quanda/toy_benchmarks/__init__.py
@@ -1,4 +1,4 @@
-from quanda.toy_benchmarks import localization, randomization, unnamed
 from quanda.toy_benchmarks.base import ToyBenchmark
+from quanda.toy_benchmarks import localization, randomization, unnamed
 
 __all__ = ["ToyBenchmark", "randomization", "localization", "unnamed"]
diff --git a/quanda/toy_benchmarks/localization/class_detection.py b/quanda/toy_benchmarks/localization/class_detection.py
@@ -4,7 +4,7 @@
 from tqdm import tqdm
 
 from quanda.metrics.localization import ClassDetectionMetric
-from quanda.toy_benchmarks.base import ToyBenchmark
+from quanda.toy_benchmarks import ToyBenchmark
 
 
 class ClassDetection(ToyBenchmark):

diff --git a/quanda/toy_benchmarks/localization/mislabeling_detection.py b/quanda/toy_benchmarks/localization/mislabeling_detection.py
@@ -8,7 +8,7 @@
 from quanda.metrics.localization.mislabeling_detection import (
     MislabelingDetectionMetric,
 )
-from quanda.toy_benchmarks.base import ToyBenchmark
+from quanda.toy_benchmarks import ToyBenchmark
 from quanda.utils.datasets.transformed.label_flipping import (
     LabelFlippingDataset,
 )

diff --git a/quanda/toy_benchmarks/localization/subclass_detection.py b/quanda/toy_benchmarks/localization/subclass_detection.py
@@ -6,7 +6,7 @@
 from tqdm import tqdm
 
 from quanda.metrics.localization.class_detection import ClassDetectionMetric
-from quanda.toy_benchmarks.base import ToyBenchmark
+from quanda.toy_benchmarks import ToyBenchmark
 from quanda.utils.datasets.transformed.label_grouping import (
     ClassToGroupLiterals,
     LabelGroupingDataset,

diff --git a/quanda/toy_benchmarks/randomization/model_randomization.py b/quanda/toy_benchmarks/randomization/model_randomization.py
@@ -6,7 +6,7 @@
 from quanda.metrics.randomization.model_randomization import (
     ModelRandomizationMetric,
 )
-from quanda.toy_benchmarks.base import ToyBenchmark
+from quanda.toy_benchmarks import ToyBenchmark
 from quanda.utils.functions import CorrelationFnLiterals
 
 

diff --git a/quanda/toy_benchmarks/unnamed/dataset_cleaning.py b/quanda/toy_benchmarks/unnamed/dataset_cleaning.py
@@ -6,7 +6,7 @@
 from tqdm import tqdm
 
 from quanda.metrics.unnamed.dataset_cleaning import DatasetCleaningMetric
-from quanda.toy_benchmarks.base import ToyBenchmark
+from quanda.toy_benchmarks import ToyBenchmark
 from quanda.utils.training.trainer import BaseTrainer
 
 

diff --git a/quanda/toy_benchmarks/unnamed/top_k_overlap.py b/quanda/toy_benchmarks/unnamed/top_k_overlap.py
@@ -4,7 +4,7 @@
 from tqdm import tqdm
 
 from quanda.metrics.unnamed import TopKOverlapMetric
-from quanda.toy_benchmarks.base import ToyBenchmark
+from quanda.toy_benchmarks import ToyBenchmark
 
 
 class TopKOverlap(ToyBenchmark):

diff --git a/src/explainers/__init__.py b/src/explainers/__init__.py
@@ -0,0 +1,18 @@
+from quanda.explainers.base import BaseExplainer
+from quanda.explainers import utils, wrappers
+from quanda.explainers.functional import ExplainFunc, ExplainFuncMini
+from quanda.explainers.random import RandomExplainer
+from quanda.explainers.aggregators import BaseAggregator, SumAggregator
+
+
+__all__ = [
+    "BaseExplainer",
+    "RandomExplainer",
+    "ExplainFunc",
+    "ExplainFuncMini",
+    "utils",
+    "wrappers",
+    "BaseAggregator",
+    "SumAggregator",
+    "AbsSumAggretor",
+]
diff --git a/src/metrics/__init__.py b/src/metrics/__init__.py
@@ -0,0 +1,14 @@
+from quanda.metrics.base import GlobalMetric, Metric
+from quanda.metrics import localization, randomization, unnamed
+from quanda.metrics.aggr_strategies import GlobalAggrStrategy, GlobalSelfInfluenceStrategy
+
+
+__all__ = [
+    "Metric",
+    "GlobalMetric",
+    "GlobalAggrStrategy",
+    "GlobalSelfInfluenceStrategy",
+    "randomization",
+    "localization",
+    "unnamed",
+]