開発・運用中のサイト
1〜2分くらいの短期間に複数のworkerが起動すると落ちる可能性がある
ログを見ると上記のことがわかった。
全てではないが、1~2分の短期間に複数のworkerが起動すると、queの最大数である3のうちいくつかのworkerが落ちる。
対応
sidekiqのque数を減らす
現在que数のmaxは3にしているが、これで落ちるので1か2にしてみる。
起動前にsleepを入れてみる
起動前にランダムで1~5分の待機時間を作って、負荷が集中しにくいようにする。