|
|
00b26af3ed
|
增加行为监控指标
|
2026-04-26 17:42:30 +08:00 |
|
|
|
5c2df10150
|
修复低电量回充卡住
|
2026-04-26 17:37:17 +08:00 |
|
|
|
f44e2483fc
|
优化 PPO 清扫策略
|
2026-04-26 17:29:03 +08:00 |
|
|
|
f04feb0cd9
|
增加PPO回充安全动作约束
|
2026-04-26 17:06:54 +08:00 |
|
|
|
e0756b4846
|
调整PPO回充模式清扫与探索奖励
|
2026-04-26 16:33:44 +08:00 |
|
|
|
3c3332e126
|
优化PPO基于电量安全余量回充
|
2026-04-26 16:20:02 +08:00 |
|
|
|
3d0a8122bb
|
修复PPO评估推理返回None异常
|
2026-04-26 15:35:19 +08:00 |
|
|
|
ba6cf2a797
|
修正PPO充电奖励防止蹲桩
|
2026-04-26 15:08:43 +08:00 |
|
|
|
efbc612945
|
优化PPO充电与避障策略
扩展观测特征到157维,加入充电桩、NPC、电量安全余量、地图统计和本步清扫信息。
增加低电量回充动作过滤、NPC危险区过滤,并调整奖励和终局日志以突出充电、避障和真实清扫得分。
|
2026-04-26 14:14:18 +08:00 |
|
|
|
eb3efa4df7
|
Optimize PPO short-run training
|
2026-04-26 12:46:00 +08:00 |
|
|
|
ca6234c941
|
Initial robot vacuum code
|
2026-04-26 12:38:39 +08:00 |
|