deepseek 学习笔记
学习路径:官方文档了解架构设计、训练方法、性能指标
学习目标:本地部署、模型推理(文本、代码、图片生成)、模型的使用方法、模型的微调(数据预处理、模型训练、评估)
一、基本了解
- 关键原则:根据任务类型选择模型,而非热度
- 从使用者变成创新者:AI 思维[建立人机协作框架]、整合力[1+1>2]、引导力[主导AI得到有效输出]、判断力[有把关能力]
- 构建好的 提示词体系,撬动 AI 的杠杆 - 发展个人方法论
- 人机协作流程优化 - 流程决定上限、创新工作流带来突破进展
deepseek-ai/DeepSeek-R1、deepseek-ai/DeepSeek-V3 开源推理模型
推理大模型 DeepSeek-R1、GPT-o3 | 非推理大模型/通用模型 GPT-3/4、DeepSeek-V3 | |
---|---|---|
优势 | 强化了推理、逻辑分析、决策能力、复杂问题解决能力 | 侧重了语言生成、上下文理解、自然语言处理,不强调深度推理 |
劣势 | 发散性任务,如诗歌创作 | 严格逻辑链的任务,如数学证明 |
本质 | 专精于逻辑密度高的任务 | 擅长多样性高的任务 |
强弱判断 | 并非全面更强,仅在训练目标领域显著优势 | 通用场景更灵活,专项任务需依赖提示语补偿 |
提示语策略 | 简洁指令,聚焦目标、需求即可 | 需显式引导推理步骤引导 |
避免误区 | 不要启发式提示,如cos,可能干扰逻辑 | 不要过度信任,复杂推理问题需分步验证 |
其他模型:
- 概率预测/快速反应模型 ChatGPT 4o:响应快,算力成本低;大量数据训练来预测答案;依赖规则决策;缺乏创新能力;
- 链式推理/慢速思考模型 OpenAI o1:慢速思考,算力成本高;逐步推理每个步骤;自主分析,实时决策;有创意能力;
AIGC 时代的提示语能力
- 问题重构能力、创意引导能力、结果优化能力、跨域整合能力、系统思维
- 基本元素:信息类、结构类、控制类
- 提示语链的设计模型:CIRS -> context-提供上下文;instruction-给出具体指示;refine-对初步输出优化;synthesis-整合所有输出,得到结果
- 针对不用平台,有不同关键词,产生不同需求
AI 幻觉
- 模型在回答问题时,表面逻辑合理的情况下,内容包含虚构、不准确的、不符合事实的信息