在這個最後的項目中,研究和開發一個人工智能(AI)模型,該模型可以學習如何自行行走或奔跑。 我們有兩種用於研究的機器人,分別稱為IT Dog和Minikame。
我們為機器人定制了合適的AI模型,強化學習是我們的主要研究方向。 有很多學習算法可以分為強化學習。 在此項目中,我們專注於PPO和DQN。 我們的目標是找到最佳算法,並在我們的機器人上成功應用定制的AI。 最後,將我們的項目結果和經驗轉換為STEM材料是積極的。 我們的研究發現,當我們開發並應用於機器人時,PPO是最好的選擇,並且我們將有大量數據將作為STEM資料傳輸以供參考。