简单随机搜索 (Simple Random Search, SRS)
- class pypop7.optimizers.rs.srs.SRS(problem, options)[源代码]
简单随机搜索 (SRS)。
注意
SRS 是一种**自适应**随机搜索方法,最初由 Rosenstein 和 Barto 为强化学习中的**直接策略搜索**而设计。由于它使用简单的*基于个体*的随机抽样策略,因此在大规模黑箱优化(LSBBO)中,其探索能力容易受到*限制*。因此,对于 LSBBO 问题,**强烈建议**首先尝试更高级的方法(例如基于种群的方法)。
此处包含它主要是为了*基准测试*。
- 参数:
problem (dict) –
- 问题参数,包含以下通用设置 (键)
'fitness_function' - 需要被最小化的目标函数 (func),
'ndim_problem' - 维度数量 (int),
'upper_boundary' - 搜索范围的上边界 (array_like),
'lower_boundary' - 搜索范围的下边界 (array_like).
options (dict) –
- 优化器选项,包含以下通用设置 (键)
'max_function_evaluations' - 函数评估的最大次数 (int, 默认: np.inf),
'max_runtime' - 允许的最大运行时间 (float, 默认: np.inf),
'seed_rng' - 随机数生成器的种子,需要明确设置 (int);
- 以及以下特定设置 (键)
‘sigma’ - 初始全局步长 (float),
“x”- 初始(起始)点 (array_like),
如果未给出,它将从一个均匀分布中随机抽样,该分布的搜索范围由 problem[‘lower_boundary’] 和 problem[‘upper_boundary’] 界定。
‘alpha’ - 全局步长因子 (float, 默认: 0.3),
‘beta’ - 用于探索-利用权衡的调整概率 (float, 默认: 0.0),
‘gamma’ - 搜索衰减因子 (float, 默认: 0.99),
‘min_sigma’ - 全局步长的最小值 (float, 默认: 0.01)。
示例
使用优化器最小化著名的测试函数 Rosenbrock
1>>> import numpy 2>>> from pypop7.benchmarks.base_functions import rosenbrock # function to be minimized 3>>> from pypop7.optimizers.rs.srs import SRS 4>>> problem = {'fitness_function': rosenbrock, # define problem arguments 5... 'ndim_problem': 2, 6... 'lower_boundary': -5*numpy.ones((2,)), 7... 'upper_boundary': 5*numpy.ones((2,))} 8>>> options = {'max_function_evaluations': 5000, # set optimizer options 9... 'seed_rng': 2022, 10... 'x': 3*numpy.ones((2,)), 11... 'sigma': 0.1} 12>>> srs = SRS(problem, options) # initialize the optimizer class 13>>> results = srs.optimize() # run the optimization process 14>>> # return the number of used function evaluations and found best-so-far fitness 15>>> print(f"SRS: {results['n_function_evaluations']}, {results['best_so_far_y']}") 16SRS: 5000, 0.0017821578376762473
关于其编码的正确性检查,由于原始论文中缺少仿真环境,我们无法提供*基于代码的可重复性报告*。作为替代,我们采用了基于比较的策略来尽可能验证其正确性(尽管仍有出错的风险)。
- alpha
全局步长因子。
- 类型:
float
- beta
用于探索-利用权衡的调整概率。
- 类型:
float
- gamma
搜索衰减因子。
- 类型:
float
- min_sigma
全局步长的最小值。
- 类型:
float
- sigma
最终全局步长(在优化过程中更新)。
- 类型:
float
- x
初始(起始)点。
- 类型:
array_like
参考文献
Rosenstein, M.T. and Grupen, R.A., 2002, May. Velocity-dependent dynamic manipulability. In Proceedings of IEEE International Conference on Robotics and Automation (pp. 2424-2429). IEEE. https://ieeexplore.ieee.org/abstract/document/1013595
Rosenstein, M.T. and Barto, A.G., 2001, August. Robot weightlifting by direct policy search. In International Joint Conference on Artificial Intelligence (pp. 839-846). https://dl.acm.org/doi/abs/10.5555/1642194.1642206