跳转至

大语言模型 (LLM)

大型语言模型原理、应用及 Agent 架构学习笔记。

目标

  1. 熟悉主流 LLM 的运行流程
  2. 找到配置友好且功能全面的模型方案
  3. 掌握知识提取技术(LangChain 等)
  4. 构建基于专业领域知识的问答系统

目录

核心概念

Embedding: 将离散的符号(单词、句子、文档)表示为连续向量的方法,使模型能够捕捉语义关系、处理多模态任务(图像、代码生成)。

LLM (Large Language Model): 基于海量文本训练的大型神经网络,能处理文本生成、问答、对话、摘要等任务。通过预训练+微调或零样本方式实现下游应用。


最后更新: 2026-03-21
创建日期: 2026-03-21
作者: gis-xh