拓扑数据分析
此条目需要扩充。 (2017年10月4日) |
此条目没有列出任何参考或来源。 (2017年10月4日) |
拓扑数据分析(Topological Data Analysis ;缩写作TDA),是应用数学当中一门在数据集的分析用上了拓扑学的新技术领域,主要用于数据挖掘和计算机视觉理论研究。要从多维度、不完整和噪声多的数据集中提取讯息,一般也具有挑战性的。
拓扑数据分析的主要问题有:
- 如何从低维度的表示去获得高维度的结构;
- 如何将离散单位添加到全局结构中。
人脑可以轻易从低维度的私人数据构建整体结构。例如,从每只眼睛中的平面图像中获取物体的三维形状并不困难。公共结构的创建也通过将时间片段中的离散组合成连续图像来执行。例如,电视图像在技术上是个别点的阵列,然而,它们被认为是单个场景。
拓扑数据分析提供了一种总体框架,以对所选择的特定度量不敏感的方式分析这些数据,并提供降低维数和对噪声的鲁棒性。以下为当中的主要方法:
- 根据接近度参数,通过一些单纯复合物系列替换一组数据元素,例如:在数据的点云中寻找出同调竹4部分。
- 通过代数拓扑分析这些拓扑结构,特别是稳定同源性的新理论。
- 将数据集的稳定同源性转码为参数化版本的Betti数字,以下称为条形码。