Python知识分享网 - 专业的Python学习网站 学Python,上Python222
大模型(LLMs)推理面 PDF 下载
匿名网友发布于:2025-04-17 15:12:43
(侵权举报)
(假如点击没反应,多刷新两次就OK!)

1. 为什么大模型推理时显存涨的那么多还一直占着?
2. 大模型在gpu和cpu上推理速度如何?
7B量级下:
3. 推理速度上,int8和fp16比起来怎么样?
根据实践经验,int8模式一般推理会明显变慢(huggingface的实现)
4. 大模型有推理能力吗?
大模型有推理能力。有下面2个方面的体现:
ChatGPT拥有in-context correction的能力,即如果说错了,给出矫正,ChatGPT能“听懂”错在哪儿了,并向正确
的方向修正。in-context correction要比in-context learning难了太多,描述越详细清楚,ChatGPT回答得越好。
要知道,越详细的描述,在预训练的文本里越难匹配到的。