无监督学习——K均值聚类（上）

序近几年在机器学习领域里面，聚类是比较热门的一个词汇。它是将数据集划分成组的任务，这些组叫做簇。其目标是划分数据，使得一个簇内的数据点非常相似且簇内的数据点非常不同。与分类算法相似，聚类算法为每个数据点分配（或预测）一个数字，表示这个点属于哪个簇。但是，与分类算法不同的是，聚类属于无监督学习，也就是说事先并不知道数据集的标签或者说特征值分类，而分类算法是监督学习，意味着已经提前知道了数据点的所属类

2021-08-15

机器学习无监督学习 K均值聚类

聚类簇

金字塔(六)-应用逻辑顺序

应用逻辑顺序当我们在写文章的时候，往往会把存在某种联系的思想放在同一组，进行讲解。之所以要把某些思想放在一起，便是因为它们之间存在着某种逻辑关系，既方便作者进行分析，也有助于读者的理解。而这种逻辑关系有三种，分别是因果关系，结构关系，重要性关系。接下来，我们就简单介绍下这三种关系。 1.时间（因果）顺序因果关系，顾名思义就是某些原因导致了某些结果。举个例子：受到市场波动，政策调控，疫情叠加的

2021-08-15

金字塔思维思考的逻辑第六章

读书笔记内化笔记应用逻辑顺序

金字塔(五)-归纳推理与演绎推理

演绎推理和归纳推理之前我们讲过金字塔结构的文章有两个表达方向，分别是纵向和横向，其中”纵向“的内容，指的是自上而下表达和自下而上分析。那么本篇文章，我们主要讨论下同一层次思想的横向表达逻辑，即演绎推理和归纳推理。演绎推理演绎推理的步骤从上面的推理图形我们可以看出，演绎推理就是个单线程的线性推理。那么我们将其化繁为简，总结成三步：提出大家广泛认可的一件事情/现象从普遍中提出某个个体依照

2021-08-15

金字塔思维表达的逻辑第五章

读书笔记内化笔记归纳推理演绎推理

金字塔(四)-序言的具体写法

序言的结构虽然在之前的章节中已经提到过序言的组成部分了，但为了引出接下来要说的内容，我还是想要再重复一遍序言的构成—“背景-冲突-疑问-解答”。具体结构如下所示：序言，是一篇“故事”当读者在拿到一篇文章准备阅读之前，他的大脑中往往会充斥很多与文章主题无关的想法。这时读者是很难去阅读文章内容的，因为那些想法在牵扯他的注意力。那么如何才能够抓住读者呢？—讲“故事”。深夜，两个衣衫褴褛的醉鬼行走

2021-08-15

金字塔思维表达的逻辑第四章

读书笔记内化笔记序言

金字塔(三)-金字塔构建

序之前我们已经知道了一篇文章的结构和逻辑顺序,那么在知道这些的情况下,我们就可以开始着手构建金字塔了.金字塔的构建有两种方法—-自上而下和自下而上,接下来我依次介绍两种方法. 自上而下通常来说,自上而下比自下而上要更为容易.因为在写文章之前,我们肯定已经确定好了文章的主题,知道写这篇文章是想表达什么.之后,再根据核心思想去依次添加其它的内容,自上而下依次搭建. 接下来,说一下构建步骤: 确定文

2021-08-15

金字塔思维表达的逻辑第三章

读书笔记内化笔记金字塔的搭建

金字塔(二)-金字塔内部的结构

序我们在表达或者是写作的时候,往往会根据一个想法联想出许多其他的想法.这时我们不能将所有的想法一股脑地都”丢”出去,如果这样做的话,受众就会被我们”砸懵”了.所以我们在表达之前一定要按照某种逻辑顺序,梳理好自己要表达的东西. 纵向“维度”这个词想必大家都不会陌生.通常,我们所写在纸上或者是键盘敲打出来的文字只有一种方向,也就是从头到尾.所以,我们就可以说文字的维度是一维的.或者说我们所写的文章就是

2021-07-26

金字塔思维表达的逻辑第二章

读书笔记内化笔记内部结构

金字塔(一)-为什么要用金字塔

归类分组共性在日常生活中,我们经常会或主动或被动地接受信息.而对于这些信息,大脑便会自发的按照某种关系将其归类划分.譬如古希腊人便将夜晚看到的星星,按照彼此之间的距离长短,并参考生活中的图像,划分成12个星座. 再譬如下面的图形: 大部分人第一眼看到上面图像的时候,便会依据散点之间的距离,自动将散点划分成左右两个图像,而我却并没有设置任何前提条件.而这便是刚才所说的:人们在接受信息的时候,会自动

2021-07-26

金字塔思维表达的逻辑第一章

读书笔记内化笔记思维结构

无监督学习——流形学习（t-SNE）

序之前我们已经说过PCA通常是用于数据变换的首选方法，使人能够用散点图将其可视化，但这一方法的性质（先旋转然后减少方向）限制了其有效性。而有一类可用于可视化的算法叫做流形学习算法，它允许进行更复杂的映射，通常也可以给出更好的可视化。其中一个特别有用的算法就是t-SNE算法。 PCA原理传送门：无监督学习与主成分分析（PCA）算法原理流形学习算法主要用于可视化，因此很少用来生成两个以上的新特征。其

2021-07-26

机器学习无监督学习流形学习

数据可视化图片分类

数据拟合实际应用

序之前我们已经学习了很多关于监督学习的算法，但是最近博主在看有关于数据分析的书籍的时候，忽然觉得在实际应用中，我们很少会用得到机器学习，数据挖掘方面的东西。我们所需要做的就是得到实际生活中的数据，并找出数据之间的关系，然后再根据这个关系去做一些运营，决策等行为，仅此而已。所以这篇我要说一下关于数据拟合的一些东西。（其实与监督学习的那些算法相比，数据拟合可以说是非常简单了。）简介数据拟合又称曲线拟

2021-07-26

数据分析数据拟合

多项式拟合 A/B测试

无监督学习——非负矩阵分解（NMF）

序非负矩阵分解（NMF）是一种无监督学习算法，其目的在于提取有用的特征。它的工作原理类似于PCA，也可以用于降维。与PCA相同，我们试图将每个数据点写成一些分量的加权求和。但在PCA中，我们想要的是正负分量，并且能够解释尽可能多的数据方差；而在NMF中，我们希望分量和系数均为负，也就是说，我们希望分量和系数都大于或等于0。因此，NMF只能应用于每个特征都是非负的数据，因为非负分量的非负求和不可能变

2021-07-26

机器学习无监督学习非负矩阵分解

分解混合信号特征重建