Topological data analysis という分野がある。多くの数値データを point cloud すなわち
Euclid空間や距離空間に配置された点の成す離散集合とみなし, それを topological な道具で調べることによりそのデータの持つ情報を取り出すことを研究する分野,
と言ってよいだろう。最近では TDA と省略して呼ばれるのが普通である。 Chazal と Michel の survey [CM]
を読むと概要が掴めるかもしれない。
その登場以来, 様々な応用が発見されている。 例えば, この webpage にまとめがある。
TDA で使われる topological な道具として中心的役割を果しているのは persistent homology である。
また, point cloud が多様体に近い形をしている場合, 元の幾何学的対象を再構築することも考えられている。 Chazal と
Oudot [CO08] は manifold reconstruction と いう言葉を使っている。Manifold learning
の方が一般的だろうか。 Boker, Turner, Williams の [BTW] では, Dey らの [CDR05; Dey07; DFW]
が参考文献として挙げられている。
もちろん多様体を復元するのは大変であるが, 多様体の不変量を point cloud から取り出せるとよい, と思う。 例えば, Dey, Fan,
Wang [DFW] は point cloud から元の多様体の次元を計算するアルゴリズムを考えている。
ただ, point cloud が多様体に近いという仮定は強すぎる。 普通は特異点があるはずである。つまり, 各 stratum が多様体である
stratified space とみなすべきである。 そのような stratified space を point cloud から再構成することを,
stratification learning あるいは stratified space learning という。 Skraba と Wang の [SW14]
に色々文献が挙げられている。 MathSciNet には収録されていない論文が多いが。 例えば, stratification learning のために,
intersection homology や local homology の persistent homology への拡張を Bendich と
Harer [BH11] が考えている。
特異点を持った多様体で最も簡単なのは, graph なので, 具体的な algorithm を考える際には, まず graph を point
cloud から再構築できるかを考えるべきだろう。実際, Boker ら [Bok+; BTW] がそのような algorithm
を考えている。
よりホモトピー論的な手法として, Blumberg と Mandell [BM13] によるものがある。Persistent
homology のようなホモロジーによる不変量で測れないものを, ホモトピー集合を用いて調べることを提案している。 もちろん,
ホモトピー集合を計算するのは大変であるが, その代わりに写像空間のホモロジーを調べることにし, 単体的複体の間の写像空間を近似する Hom
complex に似た単体的複体を構成している。彼等のアイデアの元になっているのは Gromov の quantitative homotopy
theory [Gro99] のようであるが。
Gromov の論文は, 宇宙が単連結かどうか, という話題から始まっている。 そのときに問題になるのが, 光の速度が有限であることである。例え理論的に
null homotopic な loop であっても, 1点に縮めるのに光の速度でも \(10^{30}\) 年かかるようなものなら自明でない loop
とみなしてよいのではないか, と言っている。
確かに, topological data anaylsis のような現実の問題を扱う際には, 抽象的に定義されたものではなく,
長さや大きさも考慮して定義されたホモトピー不変量を用いた方がよいだろう。
Blumberg と Lesnik は [BL] で filtered topological space の間の homotopy interleaving
の概念を導入している。
彼等は, TDA のホモトピー論的な基礎を目指しているようである。
References
-
[BH11]
-
Paul Bendich and John Harer. “Persistent intersection homology”.
In: Found. Comput. Math. 11.3 (2011), pp. 305–336. url:
http://dx.doi.org/10.1007/s10208-010-9081-1.
-
[BL]
-
Andrew J. Blumberg and Michael Lesnick. Universality of the
Homotopy Interleaving Distance. arXiv: 1705.01690.
-
[BM13]
-
Andrew J. Blumberg and Michael A. Mandell. “Quantitative
homotopy theory in topological data analysis”. In: Found.
Comput. Math. 13.6 (2013), pp. 885–911. arXiv: 1309.6628. url:
https://doi.org/10.1007/s10208-013-9177-5.
-
[Bok+]
-
Yossi Bokor, Daniel Grixti-Cheng, Markus Hegland,
Stephen Roberts, and Katharine Turner. Stratified Space Learning:
Reconstructing Embedded Graphs. arXiv: 1909.12474.
-
[BTW]
-
Yossi Bokor, Katharine Turner, and Christopher Williams. Towards
Stratified Space Learning: Linearly Embedded Graphs. arXiv:
2101.04375.
-
[CDR05]
-
Siu-Wing Cheng, Tamal K. Dey, and Edgar A. Ramos. “Manifold
reconstruction from point samples”. In: Proceedings of the Sixteenth
Annual ACM-SIAM Symposium on Discrete Algorithms. ACM, New
York, 2005, pp. 1018–1027.
-
[CM]
-
Frédéric Chazal and Bertrand Michel. An introduction to Topological
Data Analysis: fundamental and practical aspects for data scientists.
arXiv: 1710.04019.
-
[CO08]
-
Frédéric Chazal and Steve Y. Oudot. “Towards persistence-based
reconstruction in Euclidean spaces”. In: Computational geometry
(SCG’08). New York: ACM, 2008, pp. 232–241. url:
http://dx.doi.org/10.1145/1377676.1377719.
-
[Dey07]
-
Tamal K. Dey. Curve and surface reconstruction: algorithms
with mathematical analysis. Vol. 23. Cambridge Monographs on
Applied and Computational Mathematics. Cambridge University
Press, Cambridge, 2007, pp. xiv+214. isbn: 978-0-521-86370-4;
0-521-86370-8.
-
[DFW]
-
Tamal K. Dey, Fengtao Fan, and Yusu Wang. Dimension Detection
with Local Homology. arXiv: 1405.3534.
-
[Gro99]
-
Mikhael Gromov. “Quantitative homotopy theory”. In: Prospects in
mathematics (Princeton, NJ, 1996). Amer. Math. Soc., Providence,
RI, 1999, pp. 45–49.
-
[SW14]
-
Primoz Skraba and Bei Wang. “Approximating local homology from
samples”.
In: Proceedings of the Twenty-Fifth Annual ACM-SIAM Symposium
on Discrete Algorithms. ACM, New York, 2014, pp. 174–192. arXiv:
1206.0834. url: https://doi.org/10.1137/1.9781611973402.13.
|