一般建议使用发布的新版本kernel,修复bug、安全及性能问题。可以以集群级别作为升级的单位,针对单个集群/单个业务系统进行升级,做比对测试。如果有差异,则择优选择。
以我司为例,在使用过程中出现的问题,我们会对比差异,如有必要升级,则后续新装版本直接升级,旧有系统则暂时保持不变,只处理有问题机器,再在经运维、基础设施、os团队评估后合适时间统一做升级。
对于因硬件兼容性导致的问题,一般不做内核升级,而是痛过kernel module做更新管理,这样就避免版本的变化,但带来弊端是需要对模块升级做记录,并持续追踪,增加了管理成本。