Stable Baselines3
という強化学習用のライブラリがある。これはよく使用されるものなのだが、調べていくと Stable Baselines
があったり Baseline
があったりする(これらは既にメンテナンスモード)。このあたりの事情を少し調べた。
Baseline
-> Stable Baselines
-> Stable Baselines3
という流れで開発がスタートしていて、また新しい実装に置き換わって、古いものはメンテナンスモードになるという流れらしい。リポジトリを持っている団体も異なるので、このあたりの繋がりはよくわからなかった。またBaseline、Stable BaselinesはTensowflowをベースに実装されており、Stable Baselines3はPyTorchをベースに実装されている。
現時点ではStable Baselines3しか開発されていないので、どれを使うか迷うということはない。