MobilityBench: A Benchmark for Evaluating Route-Planning Agents in Real-World Mobility Scenarios
Authors
Links
87
MobileBench 是一个可扩展的基准测试,用于在真实场景中评估基于LLM的路径规划智能体,具有匿名化用户查询和用于可复现测试的确定性沙盒。
MobileBench 是一个可扩展的基准测试,用于在真实场景中评估基于LLM的路径规划智能体,具有匿名化用户查询和用于可复现测试的确定性沙盒。