基本信息
文件名称:提升大模型数学推理能力.docx
文件大小:5.62 MB
总页数:43 页
更新时间:2025-07-04
总字数:约3.94千字
文档摘要

提升大模型数学推理能力

演讲人:文亮-奇虎360-资深算法专家

DataFunCon#2024

Contents

目录

大语言模型合成数据

混合指令训练优化

混合指令

01大语言模型

大语言模型-结构总览

模型GPT3PaLMChinchillaBloomChatGLM

模型

GPT3

PaLM

Chinchilla

Bloom

ChatGLM

Llama

Baichuan

Qwen

规模

175B

540B

70B

176B

130B

65B

53B

72B

范式

Causa