AI科普系列

✨ LLM高级技巧

共 8/8 篇文章 · 用第一性原理理解AI

掌握LLM的高级用法：Few-shot、RLHF、幻觉控制

学习进度8/8 已完成

Few-shot Learning：给AI几个例子，它就学会了

为什么给AI几个示例，它就能理解你的意图？Zero-shot、One-shot、Few-shot的区别，以及如何用好这个强大的技巧。

为什么AI能在对话中学习，而不用修改参数？In-context Learning的原理、与Few-shot的关系，以及它是如何改变AI应用方式的。

AI为什么会自信地编造假信息？幻觉的本质、产生原因、以及如何减少幻觉的实用技巧。

为什么Temperature=0时AI最保守，Temperature=1时AI最疯狂？温度参数如何影响AI生成内容的确定性与多样性。

Top-k采样只保留概率最高的k个词，把其他词排除。为什么要这样做？k选多少合适？如何与温度配合？

Top-p（核采样）保留累计概率达到p的词，候选数量动态调整。为什么比Top-k更灵活？p选多少合适？

RLHF（人类反馈强化学习）让AI学会符合人类偏好。它的三阶段流程、核心原理，以及为什么让ChatGPT变得如此强大。

奖励模型是RLHF的核心组件，它学会给AI的回答打分。训练方法、关键技巧，以及如何让奖励模型更准确地模拟人类偏好。

这个系列旨在用第一性原理拆解✨ LLM高级技巧的核心概念。每篇文章都聚焦于一个具体的知识点，配有手绘图解，让复杂的概念变得简单易懂。

Few-shotLLM高级技巧Prompt