Commit Graph

4 Commits

Author SHA1 Message Date
gqt
f44e2483fc 优化 PPO 清扫策略 2026-04-26 17:29:03 +08:00
gqt
efbc612945 优化PPO充电与避障策略
扩展观测特征到157维,加入充电桩、NPC、电量安全余量、地图统计和本步清扫信息。

增加低电量回充动作过滤、NPC危险区过滤,并调整奖励和终局日志以突出充电、避障和真实清扫得分。
2026-04-26 14:14:18 +08:00
gqt
eb3efa4df7 Optimize PPO short-run training 2026-04-26 12:46:00 +08:00
gqt
ca6234c941 Initial robot vacuum code 2026-04-26 12:38:39 +08:00