简单随机搜索 (Simple Random Search, SRS)

class pypop7.optimizers.rs.srs.SRS(problem, options)[源代码]

简单随机搜索 (SRS)。

注意

SRS 是一种**自适应**随机搜索方法,最初由 Rosenstein 和 Barto 为强化学习中的**直接策略搜索**而设计。由于它使用简单的*基于个体*的随机抽样策略,因此在大规模黑箱优化(LSBBO)中,其探索能力容易受到*限制*。因此,对于 LSBBO 问题,**强烈建议**首先尝试更高级的方法(例如基于种群的方法)。

此处包含它主要是为了*基准测试*。

参数:
  • problem (dict) –

    问题参数,包含以下通用设置 ()
    • 'fitness_function' - 需要被最小化的目标函数 (func),

    • 'ndim_problem' - 维度数量 (int),

    • 'upper_boundary' - 搜索范围的上边界 (array_like),

    • 'lower_boundary' - 搜索范围的下边界 (array_like).

  • options (dict) –

    优化器选项,包含以下通用设置 ()
    • 'max_function_evaluations' - 函数评估的最大次数 (int, 默认: np.inf),

    • 'max_runtime' - 允许的最大运行时间 (float, 默认: np.inf),

    • 'seed_rng' - 随机数生成器的种子,需要明确设置 (int);

    以及以下特定设置 ()
    • ‘sigma’ - 初始全局步长 (float),

    • “x”- 初始(起始)点 (array_like),

      • 如果未给出,它将从一个均匀分布中随机抽样,该分布的搜索范围由 problem[‘lower_boundary’]problem[‘upper_boundary’] 界定。

    • ‘alpha’ - 全局步长因子 (float, 默认: 0.3),

    • ‘beta’ - 用于探索-利用权衡的调整概率 (float, 默认: 0.0),

    • ‘gamma’ - 搜索衰减因子 (float, 默认: 0.99),

    • ‘min_sigma’ - 全局步长的最小值 (float, 默认: 0.01)。

示例

使用优化器最小化著名的测试函数 Rosenbrock

 1>>> import numpy
 2>>> from pypop7.benchmarks.base_functions import rosenbrock  # function to be minimized
 3>>> from pypop7.optimizers.rs.srs import SRS
 4>>> problem = {'fitness_function': rosenbrock,  # define problem arguments
 5...            'ndim_problem': 2,
 6...            'lower_boundary': -5*numpy.ones((2,)),
 7...            'upper_boundary': 5*numpy.ones((2,))}
 8>>> options = {'max_function_evaluations': 5000,  # set optimizer options
 9...            'seed_rng': 2022,
10...            'x': 3*numpy.ones((2,)),
11...            'sigma': 0.1}
12>>> srs = SRS(problem, options)  # initialize the optimizer class
13>>> results = srs.optimize()  # run the optimization process
14>>> # return the number of used function evaluations and found best-so-far fitness
15>>> print(f"SRS: {results['n_function_evaluations']}, {results['best_so_far_y']}")
16SRS: 5000, 0.0017821578376762473

关于其编码的正确性检查,由于原始论文中缺少仿真环境,我们无法提供*基于代码的可重复性报告*。作为替代,我们采用了基于比较的策略来尽可能验证其正确性(尽管仍有出错的风险)。

alpha

全局步长因子。

类型:

float

beta

用于探索-利用权衡的调整概率。

类型:

float

gamma

搜索衰减因子。

类型:

float

min_sigma

全局步长的最小值。

类型:

float

sigma

最终全局步长(在优化过程中更新)。

类型:

float

x

初始(起始)点。

类型:

array_like

参考文献

Rosenstein, M.T. and Grupen, R.A., 2002, May. Velocity-dependent dynamic manipulability. In Proceedings of IEEE International Conference on Robotics and Automation (pp. 2424-2429). IEEE. https://ieeexplore.ieee.org/abstract/document/1013595

Rosenstein, M.T. and Barto, A.G., 2001, August. Robot weightlifting by direct policy search. In International Joint Conference on Artificial Intelligence (pp. 839-846). https://dl.acm.org/doi/abs/10.5555/1642194.1642206