如何确定语言模型的 RAM、视频内存等的数量。至少非常粗略地讲。
从两个部分来理解所需的能力是很有趣的:
- 推出完成的模型。
- 微调。
在影响硬件功率的重要参数中,我确定了以下几点:
- 参数的数量(3B、16B、128B……)——越多,所需硬件越强大。
- 量化(Q3...Q8 或 FP16...FP32)——越多,所需的硬件越强大。
- 上下文窗口的大小 - 越大,所需的硬件越强大。
其他哪些型号的特性会极大地影响功耗?那么如何根据这些特点,粗略的估算出一台服务器或者PC的具体功率呢?
如有任何建议我将不胜感激。