model evaluation 指对一个(统计/机器学习)模型的表现进行评估与比较的过程,常用来衡量模型在训练数据之外的泛化能力。常见指标包括准确率、精确率/召回率、F1、AUC、均方误差等;常见方法包括交叉验证、留出法、测试集评估等。
/ˈmɑːdəl ɪˌvæljuˈeɪʃən/
We need model evaluation before deploying the system.
在部署系统之前,我们需要进行模型评估。
Proper model evaluation uses cross-validation and a separate test set to avoid overfitting and misleading results.
规范的模型评估会使用交叉验证和独立测试集,以避免过拟合和误导性的结果。
model 源自拉丁语 modulus(“尺度、标准”),经法语进入英语,后来引申为“用来表示现实的简化形式/模型”。evaluation 来自拉丁语 valere(“有价值、强健”)的相关词形,核心含义是“评估价值”。合在一起,model evaluation 字面意思就是“对模型进行价值/效果的评估”。