python k-近邻算法实例分享

 更新时间:2014年06月11日 10:29:42   作者:  
这个算法主要工作是测量不同特征值之间的距离,有个这个距离,就可以进行分类了。简称kNN。

简单说明

这个算法主要工作是测量不同特征值之间的距离,有个这个距离,就可以进行分类了。

简称kNN。

已知:训练集,以及每个训练集的标签。

接下来:和训练集中的数据对比,计算最相似的k个距离。选择相似数据中最多的那个分类。作为新数据的分类。

python实例

复制代码 代码如下:

# -*- coding: cp936 -*-

#win系统中应用cp936编码,linux中最好还是utf-8比较好。
from numpy import *#引入科学计算包
import operator #经典python函数库。运算符模块。

#创建数据集
def createDataSet():
    group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])
    labels=['A','A','B','B']
    return group,labels

#算法核心
#inX:用于分类的输入向量。即将对其进行分类。
#dataSet:训练样本集
#labels:标签向量
def classfy0(inX,dataSet,labels,k):
    #距离计算
    dataSetSize =dataSet.shape[0]#得到数组的行数。即知道有几个训练数据
    diffMat     =tile(inX,(dataSetSize,1))-dataSet#tile:numpy中的函数。tile将原来的一个数组,扩充成了4个一样的数组。diffMat得到了目标与训练数值之间的差值。
    sqDiffMat   =diffMat**2#各个元素分别平方
    sqDistances =sqDiffMat.sum(axis=1)#对应列相乘,即得到了每一个距离的平方
    distances   =sqDistances**0.5#开方,得到距离。
    sortedDistIndicies=distances.argsort()#升序排列
    #选择距离最小的k个点。
    classCount={}
    for i in range(k):
        voteIlabel=labels[sortedDistIndicies[i]]
        classCount[voteIlabel]=classCount.get(voteIlabel,0)+1
    #排序
    sortedClassCount=sorted(classCount.iteritems(),key=operator.itemgetter(1),reverse=True)
    return sortedClassCount[0][0]

意外收获

把自己写的模块加入到python默认就有的搜索路径:在python/lib/-packages目录下建立一个 xxx.pth的文件,写入自己写的模块所在的路径即可

相关文章

  • 利用Python脚本实现传递参数的三种方式分享

    利用Python脚本实现传递参数的三种方式分享

    使用python脚本传递参数在实际工作过程中还是比较常用。这篇文章为大家总结了三个常用的方式,感兴趣的小伙伴可以跟随小编一起学习一下
    2022-12-12
  • mac安装scrapy并创建项目的实例讲解

    mac安装scrapy并创建项目的实例讲解

    今天小编就为大家分享一篇mac安装scrapy并创建项目的实例讲解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06
  • Python实现Kerberos用户的增删改查操作

    Python实现Kerberos用户的增删改查操作

    这篇文章主要介绍了Python实现Kerberos用户的增删改查操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-12-12
  • Python实现简单截取中文字符串的方法

    Python实现简单截取中文字符串的方法

    这篇文章主要介绍了Python实现简单截取中文字符串的方法,涉及Python字符串截取与编码转换的相关技巧,需要的朋友可以参考下
    2015-06-06
  • python使用lxml xpath模块解析XML遇到的坑及解决

    python使用lxml xpath模块解析XML遇到的坑及解决

    这篇文章主要介绍了python使用lxml xpath模块解析XML遇到的坑及解决,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-05-05
  • 详解python 模拟豆瓣登录(豆瓣6.0)

    详解python 模拟豆瓣登录(豆瓣6.0)

    这篇文章主要介绍了python模拟豆瓣登录,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-04-04
  • 基于Django框架的权限组件rbac实例讲解

    基于Django框架的权限组件rbac实例讲解

    今天小编就为大家分享一篇基于Django框架的权限组件rbac实例讲解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-08-08
  • Python+Selenium实现自动填写问卷

    Python+Selenium实现自动填写问卷

    本文主要介绍了Python+Selenium实现自动填写问卷,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-07-07
  • 如何利用Python批量处理行、列和单元格详解

    如何利用Python批量处理行、列和单元格详解

    因为之后的工作可能会经常用到excel,而且也不想荒废Python,出于为以后做准备以防不时之需,下面这篇文章主要给大家介绍了关于如何利用Python批量处理行、列和单元格的相关资料,需要的朋友可以参考下
    2021-09-09
  • 利用Python裁切tiff图像且读取tiff,shp文件的实例

    利用Python裁切tiff图像且读取tiff,shp文件的实例

    这篇文章主要介绍了利用Python裁切tiff图像且读取tiff,shp文件的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03

最新评论