t-SNE高维数据可视化实例

t-SNE:高维数据分布可视化

实例1:自动生成一个S形状的三维曲线

实例1结果

实例1完整代码

import matplotlib.pyplot as plt
from sklearn import manifold, datasets
"""对S型曲线数据的降维和可视化"""

x, color = datasets.make_s_curve(n_samples=1000, random_state=0)		# 生成一个S形状的三维曲线,以及相应的颜色数据,数据点的数量为1000个,随机数种子是0,color是[1000,1]的一维数据,对应每个点的颜色
n_neighbors = 10
n_components = 2   #n_neighbors和n_components分别表示t-SNE算法中的近邻数和降维后的维度数

fig = plt.figure(figsize=(15, 15))		#图像的宽和高
plt.suptitle("Dimensionality Reduction and Visualization of S-Curve Data ", fontsize=14)		#自定义图像名称

# 绘制S型曲线的3D图像
ax = fig.add_subplot(211, projection='3d')		#分为2行1列的子图布局,选择第1个子图,投影方式为3D
ax.scatter(x[:, 0], x[:, 1], x[:, 2], c=color, cmap=plt.cm.Spectral) #x[:, 0], x[:, 1], x[:, 2]代表x,y,z 绘制散点图,Spectral colormap将不同的颜色映射到数据集的不同标签上
ax.set_title('Original S-Curve', fontsize=14)
ax.view_init(4, -72)		# 将视角设置为仰角4度,方位角-72度

# t-SNE的降维与可视化
ts = manifold.TSNE(n_components=n_components,perplexity=30)  #将原始数据降低到n_components维度;perplexity=30表示t-SNE算法的困惑度参数设置为30。
# 训练模型
y = ts.fit_transform(x)
ax1 = fig.add_subplot(2, 1, 2)   ##分为2行1列的子图布局,选择第2个子图
plt.scatter(y[:, 0], y[:, 1], c=color, cmap=plt.cm.Spectral)
ax1.set_title('t-SNE Curve', fontsize=14)
plt.show()


 实例2:手写数字

实例2结果

这个由于数据量太多,呈现的效果不是很明显 

实例2完整代码

from sklearn import preprocessing
from sklearn.manifold import TSNE
import matplotlib.pyplot as plt
import torchvision

traindata = torchvision.datasets.MNIST(root='./t-SNE_dataset/', train=True, download=True)
testdata = torchvision.datasets.MNIST(root='./t-SNE_dataset/', train=False, download=True)

X_train = traindata.data    #[60000, 28, 28]
y_train = traindata.targets #[60000]
X_test = testdata.data      #[10000, 28, 28]
y_test = testdata.targets   #[10000]

X_train = X_train.view(len(X_train), -1)  #[样本数量, 特征维度];-1是根据原来的形状自动计算出新的维度大小,以保证总的元素个数不变,这里是28*28
X_test = X_test.view(len(X_test), -1)

# t-SNE降维处理
tsne = TSNE(n_components=3, verbose=1 ,random_state=42)  #n_components=3表示降维后的维度为3,即将图像数据降低到三维;verbose=1表示打印详细的日志信息;random_state=42表示设置随机种子以保证可重复性。
train = tsne.fit_transform(X_train)
test = tsne.transform(X_test)  # 注意:使用已经训练好的t-SNE对象对验证集进行降维,不再fit_transform


# 归一化处理
scaler = preprocessing.MinMaxScaler(feature_range=(-1,1))
train = scaler.fit_transform(train)
test = scaler.transform(test)  # 对验证集进行归一化处理,使用训练集的scaler对象进行transform

fig = plt.figure(figsize=(20, 20))
ax = fig.add_subplot(projection='3d') #创建一个三维坐标轴,并将它添加到图像窗口中
ax.set_title('t-SNE process')
ax.scatter(train[:,0], train[:,1], train[:,2] , c=y_train, marker='o', label='Train', s=10)  
#c=y_train表示根据训练集的标签y_train来对散点进行颜色编码,每个标签对应一个特定的颜色。s=10将每个数据点的大小设置为 10 像素,使用marker='o'表示使用圆圈形状的标记来表示训练集
ax.scatter(test[:,0], test[:,1], test[:,2] , c=y_test, marker='^', label='Test', s=10)  # 使用marker='^'表示使用三角形形状的标记来表示验证集
ax.legend()  # 添加图例,以便区分训练集和验证集

plt.show()

实例3:自己的实验(判断迁移是否有效)

实例3实验结果 :

实例3代码:

from __future__ import print_function
import torch
import torch.nn.functional as F
from torch.utils.data import DataLoader
from torch.autograd import Variable
import os
from data_loader_new import DatasetFolder
from sklearn.manifold import TSNE
import matplotlib.pyplot as plt
from sklearn import preprocessing

def sne():
    ckpt_model_0 = "E:/XD_DANN/dataset1400/result1214/mnist_mnistm_model_epoch_0.pth"
    my_net_0 = torch.load(ckpt_model_0)
    ckpt_model_9 = "E:/XD_DANN/dataset1400/result1214/mnist_mnistm_model_epoch_99.pth"
    my_net_9 = torch.load(ckpt_model_9)

    alpha = 0

    source_dataset_name = 'shallow_train'  ###
    target_dataset_name = 'deep_train'  ###
    source_image_root = os.path.join('..', 't_SNE', source_dataset_name)
    target_image_root = os.path.join('..', 't_SNE', target_dataset_name)

    dataset_source = DatasetFolder(source_image_root)
    dataloader_source = DataLoader(dataset=dataset_source,batch_size=len(dataset_source),shuffle=True,num_workers=8)
    data_source_iter = iter(dataloader_source)
    s_img, _, _ = next(data_source_iter)  #图片,标签,位置信息
    _, _, s_feature_0 = my_net_0(input_data=s_img, alpha=alpha)
    _, _, s_feature_9 = my_net_9(input_data=s_img, alpha=alpha)  #类别,领域,特征
    print("源域数据加载成功")

    dataset_target = DatasetFolder(root=target_image_root)
    dataloader_target = DataLoader(dataset=dataset_target,batch_size=len(dataset_target),shuffle=True,num_workers=8)
    data_target_iter = iter(dataloader_target)
    t_img,_ ,_ = next(data_target_iter)
    _, _, t_feature_0 = my_net_0(input_data=t_img, alpha=alpha)
    _, _, t_feature_9 = my_net_9(input_data=t_img, alpha=alpha)  # 类别,领域,特征
    print("目标域数据加载成功")

    # s_img = s_img.view(len(s_img), -1)  # [样本数量, 特征维度];-1是根据原来的形状自动计算出新的维度大小,以保证总的元素个数不变,这里是28*28
    # t_img = t_img.view(len(t_img), -1)

    s_feature_0 = s_feature_0.view(len(s_feature_0), -1)
    t_feature_0 = t_feature_0.view(len(t_feature_0), -1)
    s_feature_9 = s_feature_9.view(len(s_feature_9), -1)
    t_feature_9 = t_feature_9.view(len(t_feature_9), -1)

    tsne = TSNE(n_components=2, verbose=1,random_state=42)  # n_components=3表示降维后的维度为3,即将图像数据降低到三维;verbose=1表示打印详细的日志信息;random_state=42表示设置随机种子以保证可重复性。
    # shallow_before = tsne.fit_transform(s_img.detach().numpy())
    # deep_before = tsne.fit_transform(t_img.detach().numpy())
    shallow_before = tsne.fit_transform(s_feature_0.detach().numpy())
    deep_before = tsne.fit_transform(t_feature_0.detach().numpy())
    shallow_after = tsne.fit_transform(s_feature_9.detach().numpy())
    deep_after = tsne.fit_transform(t_feature_9.detach().numpy())

    scaler = preprocessing.MinMaxScaler(feature_range=(-1, 1))
    shallow_before = scaler.fit_transform(shallow_before)
    deep_before = scaler.fit_transform(deep_before)
    shallow_after = scaler.fit_transform(shallow_after)
    deep_after = scaler.transform(deep_after)  # 对验证集进行归一化处理,使用训练集的scaler对象进行transform

    fig = plt.figure(figsize=(30, 30))
    ax = fig.add_subplot(211)
    ax.set_title('第0轮次训练结果')
    ax.scatter(shallow_before[:, 0], shallow_before[:, 1], c='gray', marker='o', label='shallow', s=10)
    ax.scatter(deep_before[:, 0], deep_before[:, 1], c='red', marker='^', label='deep', s=10)
    ax.legend()

    ax = fig.add_subplot(212)
    ax.set_title('第99轮次训练结果')
    ax.scatter(shallow_after[:,0], shallow_after[:,1],  c='gray', marker='o', label='shallow', s=10)
    ax.scatter(deep_after[:,0], deep_after[:,1] , c='red', marker='^', label='deep', s=10)  # 使用marker='^'表示使用三角形形状的标记来表示验证集
    ax.legend()  # 添加图例,以便区分训练集和验证集
    plt.rcParams['font.sans-serif'] = ['SimHei']  ## 用来正常显示中文标签
    plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号

    plt.show()

if __name__ == '__main__':
    sne()
    print('done')

大家可以根据自己的实验需要更改代码,提醒若需要显示中文/负号,别忘了这两行代码哟!

plt.rcParams['font.sans-serif'] = ['SimHei']  ## 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号

参考:http://t.csdnimg.cn/cshBV

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/256480.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

proxysql读写分离组件部署

一、前言 在mysql一主两从架构的前提下,引入读写分离组件,可以极大的提高mysql性能,proxysql可以在高可用mysql架构发生主从故障时,进行自动的主从读写节点切换,即当mysql其他从节点当选新的主节点时,proxy…

状态管理@Prop

目录 1、父组件State到子组件Prop简单数据类型同步 2、父组件State数组项到子组件Prop简单数据类型同步 3、从父组件中的State类对象属性到Prop简单类型的同步 Prop主要用用于父组件到子组件的数据级联更新,父组件的数据变化会影响到子组件的数据变化&#xff0c…

Arma3/武装突袭3东风战役最后一关游戏无法保存的解决办法

Arma3这个游戏玩进去还是非常有可玩性的,可是在玩过了它本体自带的东风系列战役后,在最精髓的最后一关——game over这个关卡,却有个非常头疼的问题。 逃跑其实是非常简单的,但是想要无伤环游全岛确十分困难,因为这关卡…

Lazada商品详情API在电商中的价值及实时数据获取实践

一、引言 在电商行业,数据是驱动业务增长的关键。Lazada作为东南亚地区知名的电商平台,其商品详情API对于电商行业具有深远的影响。本文将探讨Lazada商品详情API在电商行业中的重要性,并介绍如何实现实时数据获取。 二、Lazada商品详情API的…

秋招总结_就业

2020秋招总结 【前言】 以下内容是写给研二学弟学妹们的秋招总结,研一的师弟师妹们如有需要,也可看看。先说一下我为什么要写这个总结: 1、时代在变化,社会在发展,一届有必要给下一届讲一些经验。 2、我平时和你们…

强大矢量图编辑器 Boxy SVG 激活最新

Boxy SVG for Mac功能介绍 1、干净,直观的UI深受Inkscape,Sketch和Adobe illustrator的启发 2、广泛支持画布上编辑对象几何,转换,绘画和其他属性 3、保存为SVG和SVGZ格式,导出为PNG,JPG,WebP和…

第二证券:耐心等待指数企稳 关注数据要素等板块

其时或是布局商场的时间窗口。2024年美联储或打开降息周期,欧洲降息预期也在增强,全球流动性有望迎来拐点。中心经济工作提及2024年的职业及工业方向,政策有望落地施行,将会为职业配备带来较多的催化要素,是具备配备价…

RTLS 解决现实场景的25种问题

实时定位系统 (RTLS) 可以改变我们理解周围世界的方式。 想想你有多少次停下来寻找某样东西。您可能正在寻找钥匙、电话、鞋子、零食、背包、办公室中的重要文件、停车场中的车辆,或者可能正在寻找街道标志或地标来引导自己。我们大多数人每天都会希望更好地了解我…

【参天引擎】华为参天引擎内核架构源码架构,多线程服务,数据节点管理,多节点间元数据管理

cantian引擎源码结构 ​专栏内容: 参天引擎内核架构 本专栏一起来聊聊参天引擎内核架构,以及如何实现多机的数据库节点的多读多写,与传统主备,MPP的区别,技术难点的分析,数据元数据同步,多主节点…

分享一个好看的vs主题

最近发现了一个很好看的vs主题(个人认为挺好看的),想要分享给大家。 主题的名字叫NightOwl,和vscode的主题颜色挺像的。操作方法也十分简单,首先我们先在最上面哪一行找到扩展。 然后点击管理扩展,再搜索栏…

北京冬雪中:邂逅那台加洛韦绿的路特斯Eletre

文|张 坤 北京的冬天时而让人情感交织:虽然雪后银装素裹,能够完美勾勒出城市寒素清澈的美景,映衬出红墙石砖的雄伟壮丽。但在深冬的寒风萧瑟中,也迫使人们紧裹衣衫,赏景之路亦多了几分艰辛。 在北京“…

9.鸿蒙app用户界面的跳转abilityslice的跳转

9.用户界面的跳转abilityslice的跳转,值传递,数值累加 首页页面显示1,第2页显示2,再次点击返回首页3。。。 MainAbilitySlice.java 关键代码: 点击事件 text.setClickedListener(new Component.ClickedListener() …

芯片高科技制造业如何实现高效且安全的文件数据传输

随着工业4.0的快速发展,制造行业作为一个长产业链且高度集中复杂的领域,数据与信息传输管理变得尤为重要,成为提高生产效率的关键因素。从研发、设计、采购、生产、库存、销售到售后等各个环节,整个业务流程都需要高效传递信息&am…

五年一贯专转本这么管用的记忆法你用了吗?

在枯燥无聊的学习当中,能有好的学习记忆方式就能事半功倍,但是怎样的学习记忆方式才适合我们呢?那我今天就给大家介绍一下吧,如果觉得好用,可以试试,让我们在之后的转本考试当中能有个好成绩!zb…

Vue2 即将结束支持!!!

Vue2 Vue 2.0 发布于 2016 年,已经有超过 7 年的历史,它是 Vue 框架成为主流的重要里程碑。许多当前的 Vue 用户都是在 Vue 2 时期就开始使用 Vue 的,并且有许多出色的项目是基于 Vue 2 构建的。 Vue2将弃用 随着 2024 年的临近&#xff0…

【DOM笔记二】操作元素(修改元素内容,修改常见元素/表单元素/元素样式属性,排他思想,自定义属性操作,应用案例!)

文章目录 4 操作元素4.1 修改元素的内容4.2 修改常见元素的属性案例:分时问候 4.3 修改表单元素属性案例:登录时隐藏/显示密码 4.4 修改元素样式属性4.4.1 行内样式操作 element.style案例1:关闭二维码广告案例2:遍历精灵图案例3&…

php自定义请求工具(请求频次+动态参数)

在项目开发中,前后端进行接口对接时,一定离不开接口测试。所以这个时候就很需要一些第三方api接口测试工具了。比如postman,apifox之类的。lz有事闲暇之余也会做点小项目,不可避免的会用到测试接口工具之类的。在进行测试时突发奇…

JS加密/解密之JSX解密解析(photoshop插件)

简介 Adobe Photoshop 插件通常使用 JSX(JavaScript XML)脚本语言。这是一种基于JavaScript的扩展,专门设计用于处理Adobe Creative Suite(包括Photoshop)的任务。JSX脚本允许开发者编写自定义脚本以扩展和增强Photos…

VueStu02-创建一个Vue实例

一、核心步骤 1.准备容器 准备一个盒子div。 2.引包 从官网引包,有开发版本和生产版本之分。 3.创建Vue实例 创建一个Vue实例,new Vue()。 4.指定配置项 指定配置项,用于渲染数据 。 el:指定挂载点。知道自己将来要管理的是…

springboot解决XSS存储型漏洞

springboot解决XSS存储型漏洞 XSS攻击 XSS 攻击:跨站脚本攻击(Cross Site Scripting),为不和 前端层叠样式表(Cascading Style Sheets)CSS 混淆,故将跨站脚本攻击缩写为 XSS。 XSS(跨站脚本攻击):是指恶意攻击者往 Web 页面里插…
最新文章