简单随机搜索 (Simple Random Search, SRS)

class pypop7.optimizers.rs.srs.SRS(problem, options)[源代码]

简单随机搜索 (SRS)。

注意

SRS 是一种**自适应**随机搜索方法，最初由 Rosenstein 和 Barto 为强化学习中的**直接策略搜索**而设计。由于它使用简单的*基于个体*的随机抽样策略，因此在大规模黑箱优化（LSBBO）中，其探索能力容易受到*限制*。因此，对于 LSBBO 问题，**强烈建议**首先尝试更高级的方法（例如基于种群的方法）。

此处包含它主要是为了*基准测试*。

参数:

problem (dict) –
问题参数，包含以下通用设置 (键)
- 'fitness_function' - 需要被最小化的目标函数 (func),
- 'ndim_problem' - 维度数量 (int),
- 'upper_boundary' - 搜索范围的上边界 (array_like),
- 'lower_boundary' - 搜索范围的下边界 (array_like).
options (dict) –
优化器选项，包含以下通用设置 (键)
- 'max_function_evaluations' - 函数评估的最大次数 (int, 默认: np.inf),
- 'max_runtime' - 允许的最大运行时间 (float, 默认: np.inf),
- 'seed_rng' - 随机数生成器的种子，需要明确设置 (int);
以及以下特定设置 (键)
- ‘sigma’ - 初始全局步长 (float),
- “x”- 初始（起始）点 (array_like)，
  - 如果未给出，它将从一个均匀分布中随机抽样，该分布的搜索范围由 problem[‘lower_boundary’] 和 problem[‘upper_boundary’] 界定。
- ‘alpha’ - 全局步长因子 (float, 默认: 0.3),
- ‘beta’ - 用于探索-利用权衡的调整概率 (float, 默认: 0.0),
- ‘gamma’ - 搜索衰减因子 (float, 默认: 0.99),
- ‘min_sigma’ - 全局步长的最小值 (float, 默认: 0.01)。

示例

使用优化器最小化著名的测试函数 Rosenbrock

>>> import numpy
>>> from pypop7.benchmarks.base_functions import rosenbrock  # function to be minimized
>>> from pypop7.optimizers.rs.srs import SRS
>>> problem = {'fitness_function': rosenbrock,  # define problem arguments
...            'ndim_problem': 2,
...            'lower_boundary': -5*numpy.ones((2,)),
...            'upper_boundary': 5*numpy.ones((2,))}
>>> options = {'max_function_evaluations': 5000,  # set optimizer options
...            'seed_rng': 2022,
...            'x': 3*numpy.ones((2,)),
...            'sigma': 0.1}
>>> srs = SRS(problem, options)  # initialize the optimizer class
>>> results = srs.optimize()  # run the optimization process
>>> # return the number of used function evaluations and found best-so-far fitness
>>> print(f"SRS: {results['n_function_evaluations']}, {results['best_so_far_y']}")
SRS: 5000, 0.0017821578376762473

关于其编码的正确性检查，由于原始论文中缺少仿真环境，我们无法提供*基于代码的可重复性报告*。作为替代，我们采用了基于比较的策略来尽可能验证其正确性（尽管仍有出错的风险）。

alpha

全局步长因子。

类型:: float

beta

用于探索-利用权衡的调整概率。

类型:: float

gamma

搜索衰减因子。

类型:: float

min_sigma

全局步长的最小值。

类型:: float

sigma

最终全局步长（在优化过程中更新）。

类型:: float

x

初始（起始）点。

类型:: array_like

参考文献

Rosenstein, M.T. and Grupen, R.A., 2002, May. Velocity-dependent dynamic manipulability. In Proceedings of IEEE International Conference on Robotics and Automation (pp. 2424-2429). IEEE. https://ieeexplore.ieee.org/abstract/document/1013595

Rosenstein, M.T. and Barto, A.G., 2001, August. Robot weightlifting by direct policy search. In International Joint Conference on Artificial Intelligence (pp. 839-846). https://dl.acm.org/doi/abs/10.5555/1642194.1642206