拓扑数据分析(常缩写 TDA)是一组把拓扑学(研究“形状/连通性”等整体结构的数学)方法用于数据分析的技术,用来从复杂、噪声大或高维数据中提取稳定的结构特征(如连通分支、环、空洞等),常见工具包括持久同调(persistent homology)。
/ˌtɑːpəˈlɑːdʒɪkəl ˈdeɪtə əˈnæləsɪs/
Topological data analysis helps us find patterns in noisy data.
拓扑数据分析能帮助我们在有噪声的数据中发现模式。
Using persistent homology, the team applied topological data analysis to compare the shapes of gene-expression trajectories across patients.
研究团队使用持久同调,将拓扑数据分析用于比较不同患者的基因表达轨迹“形状”差异。
这是一个现代复合术语,由 topological(拓扑的)+ data analysis(数据分析)组成,字面意思就是“用拓扑学方法做数据分析”。其中 topology 源自希腊语 topos(地点、位置)+ -logia / logos(学说、研究),引申为研究空间结构与整体性质的数学分支;TDA 则把这种“看整体形状”的思路迁移到数据上。