deepseek 学习笔记

Posted by CodingWithAlice on February 26, 2025

deepseek 学习笔记

学习路径:官方文档了解架构设计、训练方法、性能指标

学习目标:本地部署、模型推理(文本、代码、图片生成)、模型的使用方法、模型的微调(数据预处理、模型训练、评估)

一、基本了解

  • 关键原则:根据任务类型选择模型,而非热度
  • 从使用者变成创新者:AI 思维[建立人机协作框架]、整合力[1+1>2]、引导力[主导AI得到有效输出]、判断力[有把关能力]
    • 构建好的 提示词体系,撬动 AI 的杠杆 - 发展个人方法论
    • 人机协作流程优化 - 流程决定上限、创新工作流带来突破进展

deepseek-ai/DeepSeek-R1、deepseek-ai/DeepSeek-V3 开源推理模型

  推理大模型 DeepSeek-R1、GPT-o3 非推理大模型/通用模型 GPT-3/4、DeepSeek-V3
优势 强化了推理、逻辑分析、决策能力、复杂问题解决能力 侧重了语言生成、上下文理解、自然语言处理,不强调深度推理
劣势 发散性任务,如诗歌创作 严格逻辑链的任务,如数学证明
本质 专精于逻辑密度高的任务 擅长多样性高的任务
强弱判断 并非全面更强,仅在训练目标领域显著优势 通用场景更灵活,专项任务需依赖提示语补偿
提示语策略 简洁指令,聚焦目标、需求即可 需显式引导推理步骤引导
避免误区 不要启发式提示,如cos,可能干扰逻辑 不要过度信任,复杂推理问题需分步验证
     

其他模型:

  • 概率预测/快速反应模型 ChatGPT 4o:响应快,算力成本低;大量数据训练来预测答案;依赖规则决策;缺乏创新能力;
  • 链式推理/慢速思考模型 OpenAI o1:慢速思考,算力成本高;逐步推理每个步骤;自主分析,实时决策;有创意能力;

AIGC 时代的提示语能力

  • 问题重构能力、创意引导能力、结果优化能力、跨域整合能力、系统思维
  • 基本元素:信息类、结构类、控制类
  • 提示语链的设计模型:CIRS -> context-提供上下文;instruction-给出具体指示;refine-对初步输出优化;synthesis-整合所有输出,得到结果
  • 针对不用平台,有不同关键词,产生不同需求

AI 幻觉

  • 模型在回答问题时,表面逻辑合理的情况下,内容包含虚构、不准确的、不符合事实的信息