
改めて考えたんだけど
関節角履歴は、関節速度と比較実験したわけではないが、論理的には高減速サーボ系のS2Rには有効かも
速度は瞬間の接線だが、履歴は直近の関節角波形なので、policyが加減速・位相・遅れを暗に読める可能性がある、、、かも(増やせば増やすほど情報量が多い)
NWK/野分機械@RoboSafs01075
模倣強化学習のobsに関節角履歴(5step分)を入れたら、Sim2Real時の挙動がかなり滑らかになった。 一方で、ゼロコマンドでもその場足踏みするように。simでも再現し、参照軌道は静止しているので、policyが「静止時足踏み」という安定解を選んだ模様。 #ホビロボ制御 #Sim2Real
日本語
