< AI >

deepseek 学习笔记

Posted by CodingWithAlice on February 26, 2025

deepseek 学习笔记

学习路径：官方文档了解架构设计、训练方法、性能指标

学习目标：本地部署、模型推理（文本、代码、图片生成）、模型的使用方法、模型的微调（数据预处理、模型训练、评估）

一、基本了解

关键原则：根据任务类型选择模型，而非热度
从使用者变成创新者：AI 思维[建立人机协作框架]、整合力[1+1>2]、引导力[主导AI得到有效输出]、判断力[有把关能力]
- 构建好的 提示词体系，撬动 AI 的杠杆 - 发展个人方法论
- 人机协作流程优化 - 流程决定上限、创新工作流带来突破进展

deepseek-ai/DeepSeek-R1、deepseek-ai/DeepSeek-V3 开源推理模型

	推理大模型 DeepSeek-R1、GPT-o3	非推理大模型/通用模型 GPT-3/4、DeepSeek-V3
优势	强化了推理、逻辑分析、决策能力、复杂问题解决能力	侧重了语言生成、上下文理解、自然语言处理，不强调深度推理
劣势	发散性任务，如诗歌创作	严格逻辑链的任务，如数学证明
本质	专精于逻辑密度高的任务	擅长多样性高的任务
强弱判断	并非全面更强，仅在训练目标领域显著优势	通用场景更灵活，专项任务需依赖提示语补偿
提示语策略	简洁指令，聚焦目标、需求即可	需显式引导推理步骤引导
避免误区	不要启发式提示，如cos，可能干扰逻辑	不要过度信任，复杂推理问题需分步验证

其他模型：

概率预测/快速反应模型 ChatGPT 4o：响应快，算力成本低；大量数据训练来预测答案；依赖规则决策；缺乏创新能力；
链式推理/慢速思考模型 OpenAI o1：慢速思考，算力成本高；逐步推理每个步骤；自主分析，实时决策；有创意能力；

AIGC 时代的提示语能力

问题重构能力、创意引导能力、结果优化能力、跨域整合能力、系统思维
基本元素：信息类、结构类、控制类
提示语链的设计模型：CIRS -> context-提供上下文；instruction-给出具体指示；refine-对初步输出优化；synthesis-整合所有输出，得到结果
针对不用平台，有不同关键词，产生不同需求

AI 幻觉

模型在回答问题时，表面逻辑合理的情况下，内容包含虚构、不准确的、不符合事实的信息