基本信息
文件名称:高维线性回归中变量选择与成对化筛选的理论、方法及应用研究.docx
文件大小:35.57 KB
总页数:25 页
更新时间:2026-01-05
总字数:约3.59万字
文档摘要
高维线性回归中变量选择与成对化筛选的理论、方法及应用研究
一、引言
1.1研究背景与意义
在当今数字化信息爆炸的时代,数据规模和维度以前所未有的速度增长,高维数据在众多领域中广泛出现。在生物医学领域,基因表达谱数据包含成千上万个基因作为变量,旨在揭示基因与疾病之间的关系;在金融领域,高频交易数据涵盖众多的市场指标、交易特征以及宏观经济变量,用于资产定价、风险评估和投资策略制定;在图像识别领域,一幅高分辨率图像的每个像素点都可视为一个变量,以实现图像内容的准确分类和识别。这些领域中,数据维度往往远超样本数量,即变量维数p随着样本量n的增加而变大且通常会超过样本量,这是高维数据的显著特征。
高