GPT与大语言模型 - 生成式AI核心

Few-Shot Learning示例...

2026/04/15 1 分钟读完 #AI #GPT #大语言模型 #生成式AI

访问-- 赞-- 踩--

一、GPT架构

1.1 GPT vs BERT

GPT vs BERT:
架构: 解码器 vs 编码器
方向: 单向 vs 双向
任务: 生成 vs 理解

1.2 文本生成

from transformers import GPT2LMHeadModel, GPT2Tokenizer
model = GPT2LMHeadModel.from_pretrained('gpt2')
tokenizer = GPT2Tokenizer.from_pretrained('gpt2')
input_ids = tokenizer.encode('Hello', return_tensors='pt')
output = model.generate(input_ids, max_length=50)
print(tokenizer.decode(output[0]))

二、In-Context Learning

Few-Shot Learning示例…

三、文本生成策略

Greedy Search
Beam Search
Top-K采样
Top-P采样

最后更新: 2026年4月15日

访问 --

讨论与反馈