Struct FRLlibTrainingSettings

Defined in File RLlibTrainingSettings.h

Inheritance Relationships

Base Type

public FTrainingSettings (Struct FTrainingSettings)

struct FRLlibTrainingSettings : public FTrainingSettings

Source: Source/Schola/Training/Public/TrainingSettings/Ray/RLlibTrainingSettings.h

Dependencies: FRLlibAPPOSettings, FRLlibCheckpointSettings, FRLlibIMPALASettings, FRLlibLoggingSettings, FRLlibNetworkArchSettings, FRLlibPPOSettings, FRLlibResourceSettings, FRLlibResumeSettings, FScriptArgBuilder

Configuration struct for Ray RLlib training scripts.

Contains all settings necessary to launch and configure an RLlib training session, including algorithm selection, hyperparameters, logging, checkpointing, and resource allocation.

Public Functions

Symbol	Details
`GenerateTrainingArgs`	Generate command-line arguments for the RLlib training script.
`~FRLlibTrainingSettings`	Virtual destructor.

GenerateTrainingArgs

virtual void GenerateTrainingArgs(FScriptArgBuilder &ArgBuilder) const

Generate command-line arguments for the RLlib training script.

Parameters

ArgBuilder – [inout] The argument builder to populate with settings.

#	Direction	Name	Type	Description
1	—	`ArgBuilder`	`FScriptArgBuilder &`	The argument builder to populate with settings.

Attributes: const, virtual

Source: Source/Schola/Training/Public/TrainingSettings/Ray/RLlibTrainingSettings.h

Implementation: Source/Schola/Training/Private/TrainingSettings/Ray/RLlibTrainingSettings.cpp

`~FRLlibTrainingSettings`

virtual ~FRLlibTrainingSettings()

Virtual destructor.

Attributes: virtual

Source: Source/Schola/Training/Public/TrainingSettings/Ray/RLlibTrainingSettings.h

Implementation: Source/Schola/Training/Private/TrainingSettings/Ray/RLlibTrainingSettings.cpp

Public Members

Symbol	Details
`Timesteps`	The total number of environment timesteps to train for.
`LearningRate`	The learning rate for the optimizer.
`MinibatchSize`	The size of minibatches for gradient updates.
`TrainBatchSizePerLearner`	The training batch size per learner worker.
`NumSGDIter`	The number of SGD (stochastic gradient descent) iterations per training batch.
`Gamma`	The discount factor (gamma) for future rewards.
`LoggingSettings`	The logging settings for the training script.
`CheckpointSettings`	The checkpoint settings for the training script.
`ResumeSettings`	The resume settings for the training script.
`NetworkArchitectureSettings`	The network architecture settings for the training script.
`ResourceSettings`	The resource settings for the training script.
`Algorithm`	The algorithm to use during training (e.g.
`PPOSettings`	PPO specific settings.
`APPOSettings`	APPO specific settings.
`IMPALASettings`	IMPALA specific settings.

`Timesteps`

int Timesteps = 8000

The total number of environment timesteps to train for.

`LearningRate`

float LearningRate = 0.0003

The learning rate for the optimizer.

`MinibatchSize`

int MinibatchSize = 128

The size of minibatches for gradient updates.

`TrainBatchSizePerLearner`

int TrainBatchSizePerLearner = 256

The training batch size per learner worker.

`NumSGDIter`

int NumSGDIter = 5

The number of SGD (stochastic gradient descent) iterations per training batch.

`Gamma`

float Gamma = 0.99

The discount factor (gamma) for future rewards.

`LoggingSettings`

FRLlibLoggingSettings LoggingSettings

The logging settings for the training script.

`CheckpointSettings`

FRLlibCheckpointSettings CheckpointSettings

The checkpoint settings for the training script.

`ResumeSettings`

FRLlibResumeSettings ResumeSettings

The resume settings for the training script.

`NetworkArchitectureSettings`

FRLlibNetworkArchSettings NetworkArchitectureSettings

The network architecture settings for the training script.

`ResourceSettings`

FRLlibResourceSettings ResourceSettings

The resource settings for the training script.

`Algorithm`

ERLlibTrainingAlgorithm Algorithm = ERLlibTrainingAlgorithm::PPO

The algorithm to use during training (e.g.

SAC, PPO)

`PPOSettings`

FRLlibPPOSettings PPOSettings

PPO specific settings.

`APPOSettings`

FRLlibAPPOSettings APPOSettings

APPO specific settings.

`IMPALASettings`

FRLlibIMPALASettings IMPALASettings

IMPALA specific settings.