logTXT's Blog

  • Home

  • Tags

  • Categories

  • Archives

  • Search

notes

Posted on 2019-03-28 | Views:

第一次课:贫困与脱贫 第二次课:经济全球化

Read more »

Hello World

Posted on 2019-03-23 | Edited on 2019-03-09 | Views:

Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.

Read more »

MIS系统分析与设计(3)

Posted on 2019-03-13 | Edited on 2019-03-14 | In 学习笔记 , MIS系统分析与设计 | Views:

第三章:企业信息与数据建模

3.4 编码模型

  • 编码的含义
    • 用来代表某实体或实体某属性的一种符号,通常由数码、字母组成。
    • 例:公民、学生、职工、电话就是是实体,而身份证号码、学号、职工号、电话号码就是相应的编码。
      Read more »

互联网数据分析(4)

Posted on 2019-03-13 | Edited on 2019-03-15 | In 学习笔记 , 互联网数据分析 | Views:

第四章:聚类分析

1. 概述

聚类分析的定义

  • 聚类分析(Cluster Analysis)是一个讲数据集中的所有数据,按照相似性划分为多个类别(Cluster,簇)的过程
    • 簇是相思数据的集合
  • 聚类分析是一种无监督分类方法:无训练集和预定义的类别标号
  • 要求:聚类之后,应保证高内聚、低耦合即同类之间相似性低,不同类之间相似度低

聚类分析的作用

  • 作为一个对的工具来获得数据集中数据的分布情况
    • 首先对数据集执行聚类,获得所有簇
    • 然后根据每个簇的样本数目获得每类数据的大体分布情况
  • 作为其他数据挖掘算法的预处理步骤

聚类分析的应用

  • 谁经常光顾商店,谁买什么东西,买多少
  • 识别顾客购买模式(如喜欢一大早来买酸奶 和鲜肉、习惯周末时一次性大采购)
  • 按会员卡记录的购买次数、购买时间、性 别、性别、年龄、购物种类、金额等变量 分类
  • 刻画不同用户群的特征 聚类中异常点的分析:欺诈
  • 通过对现有用户分群,以期对不同类别的用户采用不同的营销方式,如交叉营销(cross-sell)、向上营销(up-sell)等,并对可能流失的用户提前预警并采取相应措
    施。

常用聚类分析方法:

划分法

以距离作为数据集中不同数据间的相似性度量,将数据集划分成多个簇

方法:k-means、k-medoids

层次法

对给定的数据集进行层次分解,形成一个树形的聚类结果

方法:自顶向下法、自底向上法

Read more »

Manjaro安装手册

Posted on 2019-03-09 | Edited on 2019-03-12 | In Manjaro , 安装 | Views:

获取Manjaro镜像

进入Manjaro官网

  1. 下载Manjaro的时候不需要去各种镜像网站下载,Manjaro官网会在你开始下载前自动匹配合适的镜像网站
  2. 不要使用旧版本的Manjaro安装,旧版本在系统升级时很可能会出现依赖问题导致无法升级或者安装应用,虽然有办法解决,但是为啥非要折腾自己呢?
Read more »
唐新天

唐新天

5 posts
5 categories
9 tags
0%

Tag Cloud

  • MIS1
  • Manjaro1
  • install1
  • linux1
  • 建模1
  • 数据与信息1
  • 数据分析1
  • 数据挖掘1
  • 编码1
© 2018 – 2019 唐新天
Powered by Hexo v3.8.0