« ^ »
所要時間: 約 1分

Stable Baselines3 という強化学習用のライブラリがある。これはよく使用されるものなのだが、調べていくと Stable Baselines があったり Baseline があったりする(これらは既にメンテナンスモード)。このあたりの事情を少し調べた。

Baseline -> Stable Baselines -> Stable Baselines3 という流れで開発がスタートしていて、また新しい実装に置き換わって、古いものはメンテナンスモードになるという流れらしい。リポジトリを持っている団体も異なるので、このあたりの繋がりはよくわからなかった。またBaseline、Stable BaselinesはTensowflowをベースに実装されており、Stable Baselines3はPyTorchをベースに実装されている。

現時点ではStable Baselines3しか開発されていないので、どれを使うか迷うということはない。