Macro-averaged Precision和B-cubed Precision在聚类评估中有不同的应用方式和计算原理。
Macro-averaged Precision是宏观平均精度的一种计算方式,主要用于多类别分类任务中。在这种方法中,首先计算每个类别的精度值,然后对这些精度值进行算术平均,以得到整体的宏观平均精度。这种方法在各类别样本数量大致均衡的情况下表现较好。
例如,假设有一个三分类任务,每个类别的真实标签和预测标签如下:
类别1:TP1=10, FP1=2, FN1=0
类别2:TP2=8, FP2=4, FN2=2
类别3:TP3=6, FP3=6, FN3=4
那么每个类别的精度分别为:
P1 = TP1 / (TP1 + FP1) = 10 / (10 + 2) ≈ 0.83
P2 = TP2 / (TP2 + FP2) = 8 / (8 + 4) = 0.67
P3 = TP3 / (TP3 + FP3) = 6 / (6 + 6) = 0.5
宏观平均精度则为:(P1 + P2 + P3) / 3 ≈ (0.83 + 0.67 + 0.5) / 3 ≈ 0.67。
相比之下,B-cubed Precision是一种用于评估聚类结果的度量方式。它关注每个样本点在其所属聚类中与其他点共享相同真实类别的比例。这种方法更适用于聚类任务,因为它不需要事先定义好的类别标签,而是基于聚类结果和样本点的真实标签来计算精度。
在B-cubed Precision中,首先计算每个样本点的精度,然后对所有样本点的精度取平均值。每个样本点的精度是基于其所属聚类中与其共享相同真实标签的样本点数量来计算的。这种方法能够反映聚类结果中样本点的纯度,即聚类内部样本点的相似度。
由于B-cubed Precision的计算涉及到聚类结果和真实标签的对比,而且计算过程相对复杂,这里不提供一个具体的例子。不过,需要注意的是,B-cubed Precision的计算方式使得它能够更好地反映聚类算法在保持样本点相似性和纯度方面的性能。