问题里的通用大模型似乎并不是当前广泛概念中的通用大模型?
广泛意义的“通用大模型”目前都是头部大平台型的企业和组织在打造,例如谷歌微软百度商汤之类的公司,它能够对“互联网”级的知识相关问题给出相对准确的答案,提供一个“百晓生”似的表面能力。
问题中的通用大模型是指对能通用平台日志的分析处理的大模型? 如果是聚焦到这个程度,那么和行业的运维大模型,企业运维大模型的区别只是训练数据集的差别和形成能力大小的出入了。
对日志的分析处理也是运维工作的范畴,如果按照这个理解, 上述三个概念定义只不过是覆盖范围的差距,都是运维大模型。
通用大模型需要能够处理各种通用平台和常见标准化系统,是否需要具体定出一个范围有待商榷。比如只以算力来说各种服务器硬件平台肯定应该囊括其中,但是小机的日志要不要支持?大型机呢?支持到何种程度才算“通用”,这个是要先确定下来的。
行业运维大模型可能相对清晰一些,无非就是金融行业会用到的各种软硬件平台嘛,可以给出一个列表,一一勾选支持即可。
企业运维大模型就更加确定了,特定企业用了哪些系统都是有数的,一一列出,收集数据,再评估一下够不够“大”,(数据量太少,训练效果可能不太乐观)。
如果这三种模型按照上面的分析定义清楚,那么就可以考虑分别收集相应范畴的数据开始做训练和微调工作了。至于要打造什么样的能力?首先日志分析能力肯定是没问题的;至于是否能形成故障告警和预测能力,可以考虑朝这个方向努力,大概率能够实现。