在统计学与机器学习中,“design matrix(设计矩阵)”指把所有样本的输入特征按矩阵形式组织起来的矩阵,通常记为 X:行对应样本(观测),列对应特征(自变量/解释变量)。在线性回归、广义线性模型等中,它用来连接特征与参数,从而表达模型的线性部分。也常包含一列全 1 作为截距项。(该术语在不同模型中细节约定可能略有差异。)
/dɪˈzaɪn ˈmeɪtrɪks/
We built a design matrix with three features.
我们用三个特征构建了一个设计矩阵。
After one-hot encoding the categorical variables and adding an intercept column, the design matrix became sparse and high-dimensional, which affected both memory usage and estimation.
对类别变量做独热编码并加入截距列后,设计矩阵变得稀疏且高维,这影响了内存占用和参数估计。
design 原义与“规划、设计”相关;在统计语境里,“experimental design(实验设计)”强调如何安排因素与观测。“design matrix”中的 design 由此引申为“实验/建模方案所对应的变量结构”。matrix 来自拉丁语 matrix(“母体、来源”),在数学中指“矩阵”。合起来即“把实验/模型中的变量结构用矩阵表示”。