RLMatrix ドキュメント
RLMatrixは、Pythonの代替手段を上回るパフォーマンスを持つ、C#開発者向けの包括的な強化学習フレームワークを提供します。
主な特徴
- 包括的なアルゴリズムライブラリ: PPO、DQN(C51やDQN Rainbowまでの全ての一般的な修正を含む)、GAIL、さらに開発中の多くのアルゴリズムを含みます
- 革新的なDRLワークフロー: ツールキットのC#ソース生成のおかげで、複雑なAPI要件に悩まされることなくドメイン問題に集中できます - コードに属性を追加するだけで、ツールキットが自動的に全ての強化学習の配管を生成します
- マルチヘッドサポート: 連続的、離散的、および混合アクション空間を単一のエージェントで同時に処理できます
- RNN統合: シーケンシャルまたは部分的な観測可能性問題を扱うための簡単なオプション切り替えでリカレントニューラルネットワークを有効にします
- 純粋なC#実装: TorchSharpバックエンドで完全にC#で構築され、ネイティブのパフォーマンスと完全な型安全性を提供します
- ゲームエンジン対応: UnityとGodotで実戦テスト済み
- 優れたパフォーマンス: Pythonのstable-baselines、ml-agents、Godot RLエージェントよりも高速で安定しています
- マルチ環境トレーニング: 並列(オプションでネットワーク化)環境間で学習をスケールします
- 産業グレードの分散トレーニング: 大規模な強化学習デプロイメントに対応した高性能で耐障害性のあるネットワークアーキテクチャ
- 透明なソースコード: 拡張やカスタマイズが容易なクリーンで十分に文書化されたコードベース。依存性注入による強化学習!
- 本番環境での信頼性: 長時間実行されるトレーニングセッションでの安定性と障害耐性を考慮して設計されています