AlmaLinux 9 運用ガイド 第3章

第3章:カーネルパラメータのチューニング

この章で解説する主要な技術・概念

  • カーネルパラメータの基礎と応用
    • Linuxカーネルの動作を制御するパラメータ(例:net.ipv4.tcp_fin_timeoutnet.ipv4.tcp_keepalive_timenet.core.somaxconnvm.swappinessvm.overcommit_memory)の意味と運用効果。
  • 動的変更と永続化の手法
    • sysctl コマンドを利用した動的なパラメータ変更と、設定ファイル(例: /etc/sysctl.conf/etc/sysctl.d/)への永続化方法。
  • パラメータ変更のリスク管理
    • パラメータ変更に伴う副作用と、変更の段階的な適用、モニタリング、ロールバック計画の策定について。

3.1 カーネルパラメータの基本と永続化の手法

カーネルパラメータは、Linuxシステムの動作全体に影響を及ぼすため、動的に変更した上で、その効果を検証し、最終的には設定ファイルに反映して永続化します。以下に基本的な操作例を示します。

3.1.1 動的変更の例

  • 現在の全パラメータ一覧を表示する: sudo sysctl -a
    • 例えば、TCP接続終了待機時間 (net.ipv4.tcp_fin_timeout) を一時的に30秒に変更する場合: sudo sysctl -w net.ipv4.tcp_fin_timeout=30

3.1.2 永続的な変更方法

  • /etc/sysctl.conf または /etc/sysctl.d/99-custom.conf に以下のように記述: net.ipv4.tcp_fin_timeout = 30
  • 変更を反映する: sudo sysctl -p /etc/sysctl.d/99-custom.conf

3.2 ネットワークパラメータの最適化

ネットワーク関連パラメータは、システムの通信効率や接続管理に大きく影響します。以下、代表的なパラメータの詳細とその効果を解説します。

3.2.1 net.ipv4.tcp_fin_timeout

  • 意味:
    TCP接続が終了した後、FIN_WAIT2状態で待機する時間(秒単位)を設定します。この値が短いほど、未使用の接続が早く解放され、リソースが効率的に再利用されます。
  • 効果と考慮点:
    • 低い値(例: 30秒): リソースの迅速な解放が期待できるが、一部のネットワーク環境やアプリケーションで、十分な終了手続きが行われないリスクがある。
    • 高い値: 接続が長時間残ることで、サーバー側のリソースが無駄に消費される可能性がある。
  • 設定例:
    sudo sysctl -w net.ipv4.tcp_fin_timeout=30

3.2.2 net.ipv4.tcp_keepalive_time

  • 意味:
    TCP接続がアイドル状態になった際に、最初のキープアライブパケットを送信するまでの待機時間(秒単位)を設定します。
  • 効果と考慮点:
    • 低い値(例: 300秒): 接続が切断されやすくなり、死活監視が速やかに行えるが、ネットワークトラフィックが増加する可能性がある。
    • 高い値: ネットワーク負荷は軽減されるが、実際に接続が切断された場合の検出が遅れる可能性がある。
  • 設定例:
    sudo sysctl -w net.ipv4.tcp_keepalive_time=300

3.2.3 net.core.somaxconn

  • 意味:
    システムが保有できる、未処理の接続要求(ソケットのバックログ)の最大数を指定します。
    ※ これは、listen() システムコールで指定されるバックログ上限にも影響します。
  • 効果と考慮点:
    • 高い値(例: 1024): 同時接続要求が多い場合に、接続要求をキューに溜め込むことができるため、Webサーバー等でパフォーマンス向上が期待できる。
    • 低い値: 突発的なトラフィックの急増に対応できず、接続要求が拒否される可能性がある。
  • 設定例:
    sudo sysctl -w net.core.somaxconn=1024

3.3 メモリ管理と I/O パラメータの調整

システムのパフォーマンスは、メモリ管理とディスク I/O の最適化に大きく依存します。以下、代表的なパラメータの詳細を示します。

3.3.1 vm.swappiness

  • 意味:
    システムが物理メモリからスワップ領域へのページングをどれだけ積極的に行うかを示すパラメータ。値は 0~100 の範囲で指定される。
  • 効果と考慮点:
    • 低い値(例: 10): 可能な限り物理メモリを利用し、スワップアウトを抑制する。これにより、ディスク I/O の負荷が減少し、レスポンスが向上する場合がある。
    • 高い値: スワップ領域への依存が増え、メモリ不足時のシステムの柔軟性が向上するが、ディスク I/O の負荷が高まり、パフォーマンスが低下する可能性がある。
  • 設定例:
    sudo sysctl -w vm.swappiness=10

3.3.2 vm.overcommit_memory

  • 意味:
    メモリの過剰割り当てに関する動作を制御するパラメータ。値は以下の3種類から選択する。
    • 0: カーネルがヒューリスティック(経験則)に基づいてメモリの過剰割り当てを判断する(デフォルト)。
    • 1: 常にメモリの過剰割り当てを許可する。
    • 2: 明示的に設定された制限(overcommit_ratio)に基づいてのみ割り当てを許可する。
  • 効果と考慮点:
    • 値 0: 多くのケースでバランスの取れた動作が期待できるが、極端なメモリ要求時には不安定になる可能性がある。
    • 値 1: メモリ割り当ての失敗を回避するが、過剰割り当てによりシステムが OOM (Out-Of-Memory) 状態に陥るリスクが高まる。
    • 値 2: システム全体のメモリ利用量を厳密に制御できるが、設定ミスの場合、正当な要求が拒否される可能性がある。
  • 設定例:
    sudo sysctl -w vm.overcommit_memory=1

3.4 チューニングのベストプラクティスとリスク管理

カーネルパラメータの変更は、システム全体の動作に大きな影響を及ぼすため、以下のベストプラクティスに従うことが推奨されます。

3.4.1 段階的な変更とテスト

  • 手順:
    1. 現状のパラメータ状態を必ずバックアップ(例: sudo sysctl -a > /tmp/sysctl_before.txt)。
    2. 一度に1~2個のパラメータを変更し、変更後のシステムの挙動を十分にモニタリングする。
    3. 変更による効果と副作用を評価し、問題がなければ永続化する。

3.4.2 ロールバック計画の策定

  • 注意点:
    変更前のパラメータ設定を記録しておくこと。問題発生時は、記録した値に戻すことで、迅速な復旧が可能となります。

3.4.3 継続的な監視

  • 手法:
    上記の変更がシステムに与える影響を、vmstatiostat、および統合モニタリングシステム(Prometheus、Grafana など)を用いて、継続的に監視し、必要に応じて調整を行います。

章末のまとめと次章へのつながり

まとめ

本章では、カーネルパラメータの詳細な意味と、各パラメータの値がシステムに与える効果について掘り下げました。具体的には:

  • ネットワークパラメータ
    • net.ipv4.tcp_fin_timeout:
      FIN_WAIT2状態の待機時間を調整し、リソース解放のタイミングを管理。
    • net.ipv4.tcp_keepalive_time:
      接続のアイドル状態検出時間を設定し、接続の健全性を維持。
    • net.core.somaxconn:
      同時接続要求のキューサイズを拡大し、急激なトラフィック増加に対応。
  • メモリ管理パラメータ
    • vm.swappiness:
      スワッピングの積極性を制御し、ディスク I/O の負荷を調整。
    • vm.overcommit_memory:
      メモリ過剰割り当ての挙動を制御し、システムの安定性を左右。
  • 運用のベストプラクティス
    • 変更前のバックアップ、段階的な適用、継続的なモニタリングとロールバック計画の重要性を確認。

次章へのつながり

次章では、リソース管理と制限設定に焦点を当て、inode、ファイルディスクリプタ、ソフトリミット・ハードリミットの設定についてさらに詳細な事例と運用手法を解説します。今回学んだカーネルパラメータの最適化の知識を土台に、システムリソース全体の管理をより高度に実現する方法を学んでいきます。