Child pages
  • Variable Clustering

Contents

This tool allows clustering the network variables into group of variables that are close semantically (from the Analysis menu or the shortcut  ). These clusters are designed according to the node proximity in the graph and based on the force of the arcs. A color is automatically associated with each cluster to highlight the clustering:

The number of clusters is automatically computed by using the force of the arcs. However, the associated toolbar contains a slider that allows choosing the desired number of clusters (4 in the previous example) :
 

The button  displays the hierarchical representation of the current clustering as a dendrogram. It is always possible to modify interactively the number of clusters and to observe the result on the dendrogram. A contextual menu allows displaying the comment associated with the node instead of the name. You can also copy the graph as an image. The length of the links joining the clusters is inversely proportional to the strength of the relationships between the two sets of variables: more the link is short more the rela- tionship is strong.


When the cursor is moved over the junction point of the links, a tooltip containing the value of the link based on the arc force is displayed.

The button  validates the current clustering and associates to each set of variables a class named [Factor_i]. When the button is pressed, a HTML report of the current clustering is displayed:

The button  ends the variable clustering.


Once the classes created and associated with the clusters, it is possible to perform the multiple clustering, in modeling mode that allows, for each class named [Factor_i], generating a synthetic variable from the nodes belonging to this class.

The number of clusters automatically determined by the algorithm can be limited by the convenient option in the settings. The user can modify also the stop threshold corresponding to the max KL weight a cluster can reach to be kept.