如何使用儀表板
承接我們的入門指南,您可能想知道如何監控 AI 的訓練進度。雖然在簡單示例中將結果印出到控制台已經足夠,但實際專案通常需要更複雜的監控方式。
RLMatrix 儀表板提供了訓練指標的即時視覺化,幫助您確定 AI 是否有效學習、是否已完成訓練,或是否未能取得進展。
設置儀表板
選項 1:克隆完整儲存庫
如果您想要完整的 RLMatrix 原始碼:
git clone https://github.com/asieradzk/RL_Matrix.git
選項 2:僅獲取儀表板
如果您只需要儀表板元件:
git clone --filter=blob:none --sparse https://github.com/asieradzk/RL_Matrix.gitcd RL_Matrixgit sparse-checkout set src/RLMatrix.Dashboard
運行儀表板
獲得儀表板程式碼後,您可以:
- 在您喜歡的編輯器中打開專案(如 Visual Studio 或 VS Code)
- 構建並運行專案
或者,您可以構建二進制檔案並直接運行。
由於這是一個 Blazor Server 應用程式,您會看到一個控制台視窗,輸出類似於:
info: Microsoft.Hosting.Lifetime[14]Now listening on: https://localhost:7126info: Microsoft.Hosting.Lifetime[14]Now listening on: http://localhost:5069info: Microsoft.Hosting.Lifetime[0]Application started. Press Ctrl+C to shut down.info: Microsoft.Hosting.Lifetime[0]Hosting environment: Developmentinfo: Microsoft.Hosting.Lifetime[0]Content root path: D:\path\to\your\dashboard\RLMatrix.Dashboard
如果瀏覽器視窗沒有自動打開,請在瀏覽器中導航到 https://localhost:7126。
將專案連接到儀表板
讓我們回顧一下入門指南中的模式匹配示例。當您運行訓練程式碼時,應該會在控制台中看到以下訊息:
Connected to dashboard
如果沒有看到此訊息,則表示連接出現問題。請檢查:
- 儀表板是否正在運行
- 訓練程式碼是否有正確的連接設置
- 是否有防火牆阻止連接
解讀儀表板數據
啟動訓練後,重新整理儀表板頁面。您現在應該能在左上角的下拉選單中看到您的實驗名稱。選擇它以查看訓練指標:
儀表板顯示幾個重要指標:
獎勵隨時間變化
此圖表顯示每個回合獲得的獎勵。在我們的模式匹配示例中,隨著 AI 學習正確的模式,您應該會看到 -1 獎勵出現的頻率降低。
累積獎勵隨時間變化
這顯示了隨時間累積的獎勵總和。這個圖表的斜率變化特別重要 - 當您的 AI 學會最大化獎勵時,斜率會變得更陡。
回合長度隨時間變化
這追蹤每個回合需要多少步驟。在我們簡單的模式匹配示例中,由於每個回合只有一步,這個值始終為 1。在更複雜的環境中(如 Cart-Pole),此指標可以顯示智能體是否隨著時間的推移存活更長。
損失隨時間變化
這顯示神經網絡的損失函數值。尋找總體下降的趨勢 - 這表明您的模型正在更好地擬合數據。
學習率隨時間變化
這顯示神經網絡學習率的變化。默認情況下,RLMatrix 使用一個調度器,在訓練期間會導致小幅振盪。
即時更新
儀表板最強大的功能之一是即時更新。隨著訓練的進行,儀表板會自動更新以反映最新的指標。
在我們的模式匹配示例中,您可以在控制台視窗中按 Enter 繼續訓練,並觀察儀表板即時更新。
導出訓練數據
為了進一步分析或記錄,您可以通過點擊儀表板右上角的”Export as CSV”按鈕導出訓練數據。
這允許您:
- 在 Excel 或其他工具中執行自定義分析
- 比較不同的訓練運行
- 與同事分享結果
下一步
現在您已了解如何使用儀表板監控訓練,您可以開始探索更複雜的環境和動作空間了。