Search -

Hide navigation sidebar

Hide table of contents sidebar

Toggle site navigation sidebar

Toggle table of contents sidebar

Get Start

Installation
Usage Video

mathematical theory

Notations
Vector and Martrix
Lagrange Duality

Base RL Algorithm

Trust Region Policy Optimization
Proximal Policy Optimization Algorithms

Safe RL Algorithm

Constrained Policy Optimization
Projection-Based Constrained Policy Optimization
First Order Constrained Optimization in Policy Space
Lagrangian Methods

baserl api

Base on-policy Algorithms

saferl api

First Order Algorithms
Second Order Algorithms
The Lagrange Algorithms
Penalty Function Algorithms

common

OmniSafe Buffer
OmniSafe Experiment Grid
OmniSafe Lagrange Multiplier
OmniSafe Normalizer
OmniSafe Logger

Utils

OmniSafe Config
OmniSafe Distributed
OmniSafe Math
OmniSafe Model Utils
OmniSafe Tools

Models

OmniSafe Actor
OmniSafe Critic

Toggle table of contents sidebar

Copyright © 2022, OmniSafe Team

Made with Sphinx and @pradyunsg's Furo