优秀案例-实验3降维可视化-刘与同

鸢尾花数据集可通过 sklearn 库加载，数据集的特征和标签如下：

降维时，我们使用三种降维方法对鸢尾花数据集进行降维：

首先，调入 sklearn 加载鸢尾花数据集，并将数据分为特征和标签。使用PCA、MDS 和 t-SNE 对鸢尾花数据集进行降维，降至 2 维和 3 维。最后，调用 plotly 和 matplotlib 对降维结果进行可视化。

PCA 图显示了三种鸢尾花的类别在前两（三）个主成分上的分布。尽管 Iris-setosa 显示出明显的分离，但 Iris-versicolor 和 Iris-virginica 之间存在一定的重叠。

MDS 图保留了样本间的相对距离。与 PCA 相比，MDS 更加关注样本之间的相似性。

t-SNE 图展示了更明显的类别分离，尤其是 Iris-setosa 与其他两类之间的显著差异，因为t-SNE 能够更好地捕捉到数据中的复杂结构。将其与PCA对比，我们可以发现，t-SNE在降维之后，相同类型的鸢尾花的数据点更加靠近，分类更直观，说明特征选取的区分性更强。

对比三种图我们不难发现，在这种数据集中，t-SNE的效果最佳。

Visualization Techniques 可视化技术（2025-2026学年）