BaseImitationProtocol

Full path: schola.core.protocols.base_protocol.BaseImitationProtocol

Base class for imitation learning protocols.

BaseImitationProtocol

Bases: BaseProtocol

Methods

get_data

get_data()

Get demonstration data from the environment.

Returns

A tuple containing: - Observations for each timestep - Rewards for each timestep - Termination flags - Truncation flags - Info dicts - Initial agent observations - Initial agent info dicts - Demonstration actions

get_definition

get_definition()

Get the environment definition for imitation learning.

Returns

A tuple containing: - List of agent IDs per environment - Agent types indexed by environment and agent - Observation spaces indexed by environment and agent - Action spaces indexed by environment and agent

send_startup_msg

send_startup_msg(seeds = None, options = None)

Send the startup message for imitation learning data collection.

Parameters

seeds (List) - List of random seeds for each environment.
options (List) - List of startup options for each environment.