k-means 

Economia i empresa

El terme anglès k-means clustering està definit a la Wikipedia com «a method of cluster analysis which aims to partition n observations into k clusters in which each observation belongs to the cluster with the nearest mean». En textos catalans i castellans trobem usades sovint les formes mètode de (les) k-mitjanes o método de (las) k-medias, respectivament, mantenint normalment el guionet entre la k i mitjanes.

D’acord amb les definicions trobades i les consultes fetes, cal entendre que la k és una variable —i, per tant, cal escriure-la en cursiva— que indica un nombre indeterminat de mitjanes. Això, normalment s’escriuria sense guionet, de la mateixa manera que escrivim n variables i no pas n-variables. I en anglès també, com podem veure en la definició de la Wikipedia, on es diu «n observations into k clusters». Però l’expressió k-means sempre la trobem escrita amb guionet. La raó, probablement, és que s’ha convertit en el nom propi d’un mètode o procés estadístic. En el mateix article de la Wikipedia, una mica més avall, es diu que el terme k-means va ser encunyat per James MacQueen el 1967 en l’article titulat Some methods for classification and analysis of multivariate observations. En aquest article es diu:

The main purpose of this paper is to describe a process for partitioning an N-dimensional population into k sets on the basis of a sample. The process, which is called ‘k-means’, appears to give partitions which are reasonably efficient in the sense of within-class variance. [....] Stated informally, the k-means procedure consists of simply starting with k groups each of which consists of a single random point, and thereafter adding each new point to the group whose mean the new point is nearest. After a point is added to a group, the mean of that group is adjusted in order to take account of the new point. Thus at each stage the k-means are, in fact, the means of the groups they represent (hence the term k-means).

Cal tenir en compte que totes les obres catalanes indexades pel Google a Llibres, presenten el terme amb la forma sense guionet i la k cursiva: k mitjanes.

Context

Mètode de k-means de les k mitjanes

Universitat de Barcelona. Serveis Lingüístics
XHTML i CSS