大语言模型 (LLM)¶
大型语言模型原理、应用及 Agent 架构学习笔记。
目标¶
- 熟悉主流 LLM 的运行流程
- 找到配置友好且功能全面的模型方案
- 掌握知识提取技术(LangChain 等)
- 构建基于专业领域知识的问答系统
目录¶
- 01 预训练
- 02 Transformer
- 03 GPT & BERT
- 04 RWKV
- 05 GLM
- 06 知识图谱
- 07 LangChain
- 08 MCP
- 09 向量数据库
- 10 训练方法
- AI Agents
- Deeplearning.AI
核心概念¶
Embedding: 将离散的符号(单词、句子、文档)表示为连续向量的方法,使模型能够捕捉语义关系、处理多模态任务(图像、代码生成)。
LLM (Large Language Model): 基于海量文本训练的大型神经网络,能处理文本生成、问答、对话、摘要等任务。通过预训练+微调或零样本方式实现下游应用。
最后更新:
2026-03-21
创建日期: 2026-03-21
作者:
创建日期: 2026-03-21
作者: