首发于误入深度学习

笔记 | 什么是TSNE

误入深度学习

TSNE是由T和SNE组成，也就是T分布和随机近邻嵌入（Stochastic neighbour Embedding ）。学金融、学管理和学小语种的朋友都开始学Python做数据分析了，但很多时间大家只是想知道某个东西是什么、怎么用，今天有小伙伴问我什么是TSNE，我就简单讲讲这是什么。

提示：本文为初学笔记，仅为提供相关的讨论，谢谢。

简单来说，TSNE就是一种数据可视化的工具，能够将高维数据降到2-3维（降维），然后画成图。现在也有蛮多可以直接使用的套件，如sklearn.manifold（具体可看： Sklearn TSNE官网）。

大概啥原理呢？我来根据一个教程视频来讲讲，视频我放在文章的最后啦。

假设你有一个二维空间的数据，想要转换到一维空间，图示如下：

将二维数据降到一维

你可能会说，那我直接将数据映射到y坐标不就行啦，直接映射的话，就成了一下的样子：

直接映射到Y坐标

我们知道自然条件下，数据一般都会服从某种分布，那能不能将数据根据某种规则来映射到这个分布上呢？来看下图：

映射到某个分布中

上图是说，我先选出某个点，然后计算这个点到所有点的距离，因为同一类的距离小嘛，所以映射到对应的分布上就成了以下的样子啦。

而TSNE所对应的分布就是t分布，bingo，以上就是大致的原理啦。

当然，以上的讨论就是最基本和简单的，也没法涵盖所有的内容，如果想要更深入了解，可以看看这篇文章： t-SNE完整笔记。

相关的视频我也放上来啦，作者语速非常适合练习听力。

什么是TSNEhttps://www.zhihu.com/video/1044271142529409024

参考资料：

[1] 详解可视化利器 t-SNE 算法：数无形时少直觉

[2] TSNE--目前最好的降维方法 - bonelee - 博客园

[3] 理解TSNE算法

[4] 数据降维与可视化--t-SNE - hustqb的博客 - CSDN博客

发布于 2018-11-09 17:21

文章被以下专栏收录

误入深度学习

YannLecun可以让我后悔到没有边界

两个鬼故事拜登亲华吗杉杉来了电视剧剧情门窗制作公司起名 psp乐克乐克优茶美奶茶加盟费晟字起店名 2012中超 dotaimbaai n多寿司殇情影院yy4138 科技公司起名新颖创意猪孩子起名宜用哪些字农业种植合作社起名大全集 xxxx.com 阴阳师白狼林姓宝宝起名字甘姓的女宝宝起名起名字的笔划中国合伙人原型为心爱的人起个专属名字父亲姓王母亲姓余起名吊装公司起什么名字好逸笑倾城莫言殇李·乔丹匪夷所思的意思对书店起个名字探索保护者刺五加的副作用新疆特色的公司起名少年生前被连续抽血16次?多部门介入两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”淀粉肠小王子日销售额涨超10倍高中生被打伤下体休学邯郸通报单亲妈妈陷入热恋 14岁儿子报警何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言张家界的山上“长”满了韩国人？男孩8年未见母亲被告知被遗忘中国拥有亿元资产的家庭达13.3万户 19岁小伙救下5人后溺亡多方发声 315晚会后胖东来又人满为患了张立群任西安交通大学校长 “重生之我在北大当嫡校长”男子被猫抓伤后确诊“猫抓病”测试车高速逃费小米：已补缴周杰伦一审败诉网易网友洛杉矶偶遇贾玲今日春分倪萍分享减重40斤方法七年后宇文玥被薅头发捞上岸许家印被限制高消费萧美琴窜访捷克外交部回应联合利华开始重组专访95后高颜值猪保姆胖东来员工每周单休无小长假男子被流浪猫绊倒投喂者赔24万小米汽车超级工厂正式揭幕黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发当地回应沈阳致3死车祸车主疑毒驾恒大被罚41.75亿到底怎么缴妈妈回应孩子在校撞护栏坠楼外国人感慨凌晨的中国很安全杨倩无缘巴黎奥运校方回应护栏损坏小学生课间坠楼房客欠租失踪房东直发愁专家建议不必谈骨泥色变王树国卸任西安交大校长师生送别手机成瘾是影响睡眠质量重要因素国产伟哥去年销售近13亿阿根廷将发行1万与2万面值的纸币兔狲“狲大娘”因病死亡遭遇山火的松茸之乡 “开封王婆”爆火：促成四五十对奥巴马现身唐宁街黑色着装引猜测考生莫言也上北大硕士复试名单了德国打算提及普京时仅用姓名天水麻辣烫把捣辣椒大爷累坏了

两个鬼故事 XML地图 TXT地图虚拟主机 SEO 网站制作网站优化