python kmeans聚类简单介绍和实现代码

 更新时间:2018年02月23日 10:42:39   作者:Jason____zhou  
这篇文章主要为大家详细介绍了python kmeans聚类简单介绍和实现代码,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

一、k均值聚类的简单介绍

假设样本分为c类,每个类均存在一个中心点,通过随机生成c个中心点进行迭代,计算每个样本点到类中心的距离(可以自定义、常用的是欧式距离)  

将该样本点归入到最短距离所在的类,重新计算聚类中心,进行下次的重新划分样本,最终类中心不改变时,聚类完成   

二、伪代码  

三、python代码实现  

#!/usr/bin/env python 
# coding=utf-8 
 
import numpy as np 
import random 
import matplotlib.pyplot as plt 
 
#data:numpy.array dataset 
#k the number of cluster 
def k_means(data,k): 
   
  #random generate cluster_center 
  sample_num=data.shape[0] 
  center_index=random.sample(range(sample_num),k) 
  cluster_cen=data[center_index,:] 
 
  is_change=1 
  cat=np.zeros(sample_num) 
   
 
  while is_change: 
    is_change=0 
 
    for i in range(sample_num): 
      min_distance=100000 
      min_index=0 
 
      for j in range(k): 
        sub_data=data[i,:]-cluster_cen[j,:] 
        distance=np.inner(sub_data,sub_data) 
        if distance<min_distance: 
          min_distance=distance 
          min_index=j+1 
 
      if cat[i]!=min_index: 
        is_change=1 
        cat[i]=min_index 
    for j in range(k): 
      cluster_cen[j]=np.mean(data[cat==(j+1)],axis=0) 
 
  return cat,cluster_cen 
 
 
if __name__=='__main__': 
 
  #generate data 
  cov=[[1,0],[0,1]] 
  mean1=[1,-1] 
  x1=np.random.multivariate_normal(mean1,cov,200) 
 
  mean2=[5.5,-4.5] 
  x2=np.random.multivariate_normal(mean2,cov,200) 
 
  mean3=[1,4] 
  x3=np.random.multivariate_normal(mean3,cov,200) 
 
  mean4=[6,4.5] 
  x4=np.random.multivariate_normal(mean4,cov,200) 
 
  mean5=[9,0.0] 
  x5=np.random.multivariate_normal(mean5,cov,200) 
   
  X=np.vstack((x1,x2,x3,x4,x5)) 
   
  #data distribution 
  fig1=plt.figure(1) 
  p1=plt.scatter(x1[:,0],x1[:,1],marker='o',color='r',label='x1') 
  p2=plt.scatter(x2[:,0],x2[:,1],marker='+',color='m',label='x2') 
  p3=plt.scatter(x3[:,0],x3[:,1],marker='x',color='b',label='x3') 
  p4=plt.scatter(x4[:,0],x4[:,1],marker='*',color='g',label='x4') 
  p5=plt.scatter(x5[:,0],x4[:,1],marker='+',color='y',label='x5') 
  plt.title('original data') 
  plt.legend(loc='upper right') 
   
  cat,cluster_cen=k_means(X,5)    
 
  print 'the number of cluster 1:',sum(cat==1) 
  print 'the number of cluster 2:',sum(cat==2) 
  print 'the number of cluster 3:',sum(cat==3) 
  print 'the number of cluster 4:',sum(cat==4) 
  print 'the number of cluster 5:',sum(cat==5) 
 
   
  fig2=plt.figure(2) 
  for i,m,lo,label in zip(range(5),['o','+','x','*','+'],['r','m','b','g','y'],['x1','x2','x3','x4','x5']): 
 
    p=plt.scatter(X[cat==(i+1),0],X[cat==(i+1),1],marker=m,color=lo,label=label) 
  plt.legend(loc='upper right') 
  plt.title('the clustering result') 
  plt.show() 

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

相关文章

  • python面向对象多线程爬虫爬取搜狐页面的实例代码

    python面向对象多线程爬虫爬取搜狐页面的实例代码

    这篇文章主要介绍了python面向对象多线程爬虫爬取搜狐页面的实例代码,需要的朋友可以参考下
    2018-05-05
  • opencv深入浅出了解机器学习和深度学习

    opencv深入浅出了解机器学习和深度学习

    机器学习是人工智能的核心,专门研究如何让计算机模拟和学习人类的行为。 深度学习是机器学习中的一个热门研究方向,它主要研究样本数据的内在规律和表示层次,让计算机能够让人一样具有分析与学习能力
    2022-03-03
  • Django中间件整合Vue拦截器的使用

    Django中间件整合Vue拦截器的使用

    本文主要介绍了Django中间件整合Vue拦截器的使用,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-09-09
  • python文字转语音的实例代码分析

    python文字转语音的实例代码分析

    在本篇文章里小编给大家整理的是关于python文字转语音的实例代码分析,有需要的朋友们可以参考下。
    2019-11-11
  • 教大家玩转Python字符串处理的七种技巧

    教大家玩转Python字符串处理的七种技巧

    这篇文章主要给大家介绍了关于学会Python字符串处理的七种技巧,其中包括字符串的连接和合并、字符串的切片和相乘、字符串的分割、字符串的开头和结尾的处理、字符串的查找和匹配、字符串的替换以及字符串中去掉一些字符等操作,需要的朋友可以参考。
    2017-03-03
  • Django在urls.py利用函数path()配置路由时传递参数给调用的视图函数的方法(推荐)

    Django在urls.py利用函数path()配置路由时传递参数给调用的视图函数的方法(推荐)

    这篇文章主要介绍了Django在urls.py利用函数path()配置路由时传递参数给调用的视图函数的方法(推荐),本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧
    2024-01-01
  • Python向Excel写入内容的常用方法大全

    Python向Excel写入内容的常用方法大全

    将数据写入Excel文件中,用python实现起来非常的简单,这篇文章主要给大家介绍了关于Python向Excel写入内容的常用方法,文中通过代码介绍的非常详细,需要的朋友可以参考下
    2023-12-12
  • vscode使用chatGPT 的方法

    vscode使用chatGPT 的方法

    ChatGPT是基于GPT-3模型的对话生成模型,可以根据上下文生成自然语言文本来模拟人类对话,这篇文章主要介绍了vscode使用chatGPT ,需要的朋友可以参考下
    2022-12-12
  • Python while 循环使用的简单实例

    Python while 循环使用的简单实例

    下面小编就为大家带来一篇Python while 循环使用的简单实例。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2016-06-06
  • python Django模板的使用方法(图文)

    python Django模板的使用方法(图文)

    模板通常用于产生HTML,但是Django的模板也能产生任何基于文本格式的文档。
    2013-11-11

最新评论