聚类的k值确定之轮廓系数

发布于 2024-10-27

2048

版权声明

我们非常重视原创文章，为尊重知识产权并避免潜在的版权问题，我们在此提供文章的摘要供您初步了解。如果您想要查阅更为详尽的内容，访问作者的公众号页面获取完整文章。

查看原文：聚类的k值确定之轮廓系数

文章来源：

Python学习杂记

扫码关注公众号

扫码阅读

手机扫码阅读

文章摘要

确定聚类簇数的轮廓系数方法概述

在进行聚类分析时，确定最佳聚类簇数（如k-means中的k值）常使用手肘法，但这方法存在主观误差。轮廓系数，由Peter J. Rousseeuw于1986年提出，是一个评价聚类效果的指标，它通过计算内聚度和分离度来评估聚类的k值。

轮廓系数的定义与计算

轮廓系数是用来衡量一个聚类结果的紧密度和分离度，其公式为 s = (b-a)/max(a,b)，其中a是簇内不相似度的平均值即内聚度，b是簇间不相似度的平均值即分离度。通过计算每个点的轮廓系数并求平均值，可以得到整个模型的轮廓系数。

轮廓系数的解释

轮廓系数的值介于-1到1之间，值越大表示聚类结果越好。负值表示聚类效果不佳，接近0表示聚类结果不明显，而接近1则表示聚类结果很好。

k-means算法流程

k-means算法包括选择初始质心、将点指派到最近质心形成簇、计算新的聚类中心以及迭代上述步骤直到质心不变。

轮廓系数的计算实践

可以使用sklearn的silhouette_score函数直接计算轮廓系数。通过实例演示，当k值为3时，轮廓系数最大，建议分为3类。此外，也可以手动计算轮廓系数，包括内聚度、分离度和每个点的轮廓系数的计算。

评价和局限性

虽然轮廓系数是一个有用的指标，但它对于凸簇结构的数据效果较好，对于需要使用DBSCAN等算法聚类的非凸簇结构数据效果则不佳。因此，在使用轮廓系数评价不同聚类算法时应注意其局限性。

Python学习杂记

查看原文：聚类的k值确定之轮廓系数

文章来源：

Python学习杂记

扫码关注公众号

相关推荐

Swagger快速入门：打造清晰的API文档

927

Swagger 是一个规范和完整的框架，用于生成、描述、调用和可视化 RESTful 风格的 Web 服务(\x26lt;https://swagger.io/\x26gt;)

Swift入门基础：可选类型

1028

可选 nil 解包类型

详细介绍Swift语言的可选类型

nestjs版若依全栈管理后台完全开源！

1799

nest admin https nestjs

nestjs全栈管理系统，帮助前端轻松做全栈

滚雪球学Java(08)：深入理解Java变量、常量及其作用域

1119

变量 Java 代码 message

一文带你深入理解Java变量、常量及其作用域！直接起飞...

Kafka开发实战从入门到放弃

52

Kafka 消息 < String>

Kafka开发实战从入门到放弃

什么是FPGA？为什么FPGA会如此重要?

800

FPGA cin CPU Xilinx

CPU、GPU、FPGA三者能力相加就是芯片的未来！

Python学习杂记

探索运筹优化、机器学习、AI 和数据可视化的奥秘及其落地应用

280 篇文章

浏览 374.5K

还在用多套工具管项目？

一个平台搞定产品、项目、质量与效能，告别整合之苦，实现全流程闭环。

Python学习杂记的其他文章

初探Bokeh包：用Python实现惊艳的数据可视化

Python的Bokeh包是一个用于数据可视化的强大工具。它提供了一种简单而灵活的方式来创建各种交互式图形，并且能够在Web浏览器中进行展示。

一份超全Python代码汇总备忘清单

今天，我给大家分享一份我在GitHub上搜集的Python编程代码汇总备忘清单。

使用Python第三方库高效处理时间数据

在之前的文章中，介绍了python使用自带的库来处理时间数据，本文介绍使用第三方库来处理时间数据。

Plotly可视化介绍（一）

Plotly是一个开源、交互式和基于浏览器的Python图形库，可以创建能在仪表板或网站中使用的交互式图表。

把py程序封装成可执行文件

程序封装指把程序脚本进行一些打包、解析、整合处理生成一个新的文件。封装以后，其他没有安装（python）的电脑也能运行该程序，也能实现该程序的结果。

随机阅读

知识管理的新发现，重新学会学习，读《学习学习》

用户故事地图实际应用

水晶方法概论（三）：Crystal 的增量实践

张嘴吃安利之 PhpStorm 中的 HTTP 客户端

如何评估需求？

加入社区微信群

与行业大咖零距离交流学习

PMO实践白皮书
白皮书上线

联系我们
电话：4006 8899 23 邮箱：beining@chandao.com
融实践库
关于我们加入我们
微信号：rongpmcom
立即学习
微信公众号
微信视频号
社区微信群

友情链接：禅道项目管理软件云禅道敏捷开发喧喧IM ZDOO协同办公 ZTF自动化测试框架 ZenData测试数据生成器 ZenDAS数据分析渠成企业软件百宝箱 ZenShot开源截图工具 ZenPanel服务控制面板敏捷咨询