Source code for ml.optimizers.sgd

"""Defines a simple SGD optimizer."""

from dataclasses import dataclass

from torch import nn
from torch.optim.sgd import SGD

from ml.core.config import conf_field
from ml.core.registry import register_optimizer
from ml.optimizers.base import BaseOptimizer, BaseOptimizerConfig
from ml.optimizers.common import separate_decayable_params


[docs]@dataclass
class SGDOptimizerConfig(BaseOptimizerConfig):
    lr: float = conf_field(1e-3, help="Learning rate")
    momentum: float = conf_field(0.0, help="Momentum term for all parameters")
    dampening: float = conf_field(0.0, help="Dampening for momentum")
    nesterov: bool = conf_field(False, help="Enable Nesterov momentum")
    weight_decay: float = conf_field(1e-5, help="Weight decay regularization to use")
    default_decay: bool = conf_field(True, help="Whether to decay module params which aren't explicitly specified")


[docs]@register_optimizer("sgd", SGDOptimizerConfig)
class SGDOptimizer(BaseOptimizer[SGDOptimizerConfig, SGD]):
[docs]    def get(self, model: nn.Module) -> SGD:
        return SGD(
            separate_decayable_params(model, self.config.default_decay, self.config.weight_decay),
            lr=self.config.lr,
            momentum=self.config.momentum,
            dampening=self.config.dampening,
            nesterov=self.config.nesterov,
            **self.common_kwargs,
        )