scipy.cluster.hierarchy.

is_valid_linkage#

scipy.cluster.hierarchy.is_valid_linkage(Z, warning=False, throw=False, name=None)[source]#

檢查連結矩陣的有效性。

若連結矩陣有效,則它必須是具有 \(n\) 列和 4 欄的 2 維陣列(雙精度型別)。前兩欄必須包含介於 0 和 \(2n-1\) 之間的索引。對於給定的列 i,以下兩個表達式必須成立

\[0 \leq \mathtt{Z[i,0]} \leq i+n-1 0 \leq Z[i,1] \leq i+n-1\]

亦即,除非要加入的叢集已產生,否則叢集不能加入另一個叢集。

參數:
Zarray_like

連結矩陣。

warningbool, 選擇性

若為 True,則當傳遞的連結矩陣無效時,發出 Python 警告。

throwbool, 選擇性

若為 True,則當傳遞的連結矩陣無效時,拋出 Python 例外。

namestr, 選擇性

此字串指的是無效連結矩陣的變數名稱。

回傳值:
bbool

若不一致矩陣有效,則為 True。

另請參閱

linkage

以取得連結矩陣的描述。

範例

>>> from scipy.cluster.hierarchy import ward, is_valid_linkage
>>> from scipy.spatial.distance import pdist

此模組中分群方法產生的所有連結矩陣都將有效(亦即,它們將具有適當的維度,且兩個必要的表達式將適用於所有列)。

我們可以透過 scipy.cluster.hierarchy.is_valid_linkage 來檢查此項

>>> X = [[0, 0], [0, 1], [1, 0],
...      [0, 4], [0, 3], [1, 4],
...      [4, 0], [3, 0], [4, 1],
...      [4, 4], [3, 4], [4, 3]]
>>> Z = ward(pdist(X))
>>> Z
array([[ 0.        ,  1.        ,  1.        ,  2.        ],
       [ 3.        ,  4.        ,  1.        ,  2.        ],
       [ 6.        ,  7.        ,  1.        ,  2.        ],
       [ 9.        , 10.        ,  1.        ,  2.        ],
       [ 2.        , 12.        ,  1.29099445,  3.        ],
       [ 5.        , 13.        ,  1.29099445,  3.        ],
       [ 8.        , 14.        ,  1.29099445,  3.        ],
       [11.        , 15.        ,  1.29099445,  3.        ],
       [16.        , 17.        ,  5.77350269,  6.        ],
       [18.        , 19.        ,  5.77350269,  6.        ],
       [20.        , 21.        ,  8.16496581, 12.        ]])
>>> is_valid_linkage(Z)
True

然而,如果我們以錯誤的方式建立連結矩陣 - 或者如果我們以任何必要表達式不再成立的方式修改有效的矩陣,則檢查將會失敗

>>> Z[3][1] = 20    # the cluster number 20 is not defined at this point
>>> is_valid_linkage(Z)
False