第一次课:贫困与脱贫 第二次课:经济全球化
Hello World
Posted on
|
Edited on
|
Views:
Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.
MIS系统分析与设计(3)
互联网数据分析(4)
第四章:聚类分析
1. 概述
聚类分析的定义
- 聚类分析(Cluster Analysis)是一个讲数据集中的所有数据,按照相似性划分为多个类别(Cluster,簇)的过程
- 簇是相思数据的集合
- 聚类分析是一种无监督分类方法:无训练集和预定义的类别标号
- 要求:聚类之后,应保证高内聚、低耦合即同类之间相似性低,不同类之间相似度低
聚类分析的作用
- 作为一个对的工具来获得数据集中数据的分布情况
- 首先对数据集执行聚类,获得所有簇
- 然后根据每个簇的样本数目获得每类数据的大体分布情况
- 作为其他数据挖掘算法的预处理步骤
聚类分析的应用
- 谁经常光顾商店,谁买什么东西,买多少
- 识别顾客购买模式(如喜欢一大早来买酸奶 和鲜肉、习惯周末时一次性大采购)
- 按会员卡记录的购买次数、购买时间、性 别、性别、年龄、购物种类、金额等变量 分类
- 刻画不同用户群的特征 聚类中异常点的分析:欺诈
- 通过对现有用户分群,以期对不同类别的用户采用不同的营销方式,如交叉营销(cross-sell)、向上营销(up-sell)等,并对可能流失的用户提前预警并采取相应措
施。
常用聚类分析方法:
划分法
以距离作为数据集中不同数据间的相似性度量,将数据集划分成多个簇
方法:k-means、k-medoids
层次法
对给定的数据集进行层次分解,形成一个树形的聚类结果
方法:自顶向下法、自底向上法
Manjaro安装手册
获取Manjaro镜像
进入Manjaro官网
- 下载Manjaro的时候不需要去各种镜像网站下载,Manjaro官网会在你开始下载前自动匹配合适的镜像网站
- 不要使用旧版本的Manjaro安装,旧版本在系统升级时很可能会出现依赖问题导致无法升级或者安装应用,虽然有办法解决,但是为啥非要折腾自己呢?