NumPy 排序、條件刷選函數
NumPy 提供了多種排序的方法。 這些排序函數實現不同的排序演算法,每個排序演算法的特徵在於執行速度,最壞情況性能,所需的工作空間和演算法的穩定性。 下表顯示了三種排序演算法的比較。
種類 | 速度 | 最壞情況 | 工作空間 | 穩定性 |
---|---|---|---|---|
'quicksort' (快速排序) |
1 | O(n^2) |
0 | 否 |
'mergesort' (歸併排序) |
2 | O(n*log(n)) |
~n/2 | 是 |
'heapsort' (堆排序) |
3 | O(n*log(n)) |
0 | 否 |
numpy.sort()
numpy.sort() 函數返回輸入數組的排序副本。函數格式如下:
numpy.sort(a, axis, kind, order)
參數說明:
- a: 要排序的數組
- axis: 沿著它排序數組的軸,如果沒有數組會被展開,沿著最後的軸排序, axis=0 按列排序,axis=1 按行排序
- kind: 默認為'quicksort'(快速排序)
- order: 如果數組包含字段,則是要排序的字段
實例
輸出結果為:
我們的數組是: [[3 7] [9 1]] 調用 sort() 函數: [[3 7] [1 9]] 按列排序: [[3 1] [9 7]] 我們的數組是: [(b'raju', 21) (b'anil', 25) (b'ravi', 17) (b'amar', 27)] 按 name 排序: [(b'amar', 27) (b'anil', 25) (b'raju', 21) (b'ravi', 17)]
numpy.argsort()
numpy.argsort() 函數返回的是數組值從小到大的索引值。
實例
輸出結果為:
我們的數組是: [3 1 2] 對 x 調用 argsort() 函數: [1 2 0] 以排序後的順序重構原數組: [1 2 3] 使用迴圈重構原數組 1 2 3
numpy.lexsort()
numpy.lexsort() 用於對多個序列進行排序。把它想像成對電子錶格進行排序,每一列代表一個序列,排序時優先照顧靠後的列。
這裏舉一個應用場景:小升初考試,重點班錄取學生按照總成績錄取。在總成績相同時,數學成績高的優先錄取,在總成績和數學成績都相同時,按照英語成績錄取…… 這裏,總成績排在電子錶格的最後一列,數學成績在倒數第二列,英語成績在倒數第三列。
實例
輸出結果為:
調用 lexsort() 函數: [3 1 0 2] 使用這個索引來獲取排序後的數據: ['amar, f.y.', 'anil, s.y.', 'raju, f.y.', 'ravi, s.y.']
上面傳入 np.lexsort 的是一個tuple,排序時首先排 nm,順序為:amar、anil、raju、ravi 。綜上排序結果為 [3 1 0 2]。
msort、sort_complex、partition、argpartition
函數 | 描述 |
---|---|
msort(a) | 數組按第一個軸排序,返回排序後的數組副本。np.msort(a) 相等於 np.sort(a, axis=0)。 |
sort_complex(a) | 對複數按照先實部後虛部的順序進行排序。 |
partition(a, kth[, axis, kind, order]) | 指定一個數,對數組進行分區 |
argpartition(a, kth[, axis, kind, order]) | 可以通過關鍵字 kind 指定演算法沿著指定軸對數組進行分區 |
複數排序:
>>> import numpy as np >>> np.sort_complex([5, 3, 6, 2, 1]) array([ 1.+0.j, 2.+0.j, 3.+0.j, 5.+0.j, 6.+0.j]) >>> >>> np.sort_complex([1 + 2j, 2 - 1j, 3 - 2j, 3 - 3j, 3 + 5j]) array([ 1.+2.j, 2.-1.j, 3.-3.j, 3.-2.j, 3.+5.j])
partition() 分區排序:
>>> a = np.array([3, 4, 2, 1]) >>> np.partition(a, 3) # 將數組 a 中所有元素(包括重複元素)從小到大排列,3 表示的是排序數組索引為 3 的數字,比該數字小的排在該數字前面,比該數字大的排在該數字的後面 array([2, 1, 3, 4]) >>> >>> np.partition(a, (1, 3)) # 小於 1 的在前面,大於 3 的在後面,1和3之間的在中間 array([1, 2, 3, 4])
找到數組的第 3 小(index=2)的值和第 2 大(index=-2)的值
>>> arr = np.array([46, 57, 23, 39, 1, 10, 0, 120]) >>> arr[np.argpartition(arr, 2)[2]] 10 >>> arr[np.argpartition(arr, -2)[-2]] 57
同時找到第 3 和第 4 小的值。注意這裏,用 [2,3] 同時將第 3 和第 4 小的排序好,然後可以分別通過下標 [2] 和 [3] 取得。
>>> arr[np.argpartition(arr, [2,3])[2]] 10 >>> arr[np.argpartition(arr, [2,3])[3]] 23
numpy.argmax() 和 numpy.argmin()
numpy.argmax() 和 numpy.argmin()函數分別沿給定軸返回最大和最小元素的索引。
實例
輸出結果為:
我們的數組是: [[30 40 70] [80 20 10] [50 90 60]] 調用 argmax() 函數: 7 展開數組: [30 40 70 80 20 10 50 90 60] 沿軸 0 的最大值索引: [1 2 0] 沿軸 1 的最大值索引: [2 0 1] 調用 argmin() 函數: 5 展開數組中的最小值: 10 沿軸 0 的最小值索引: [0 1 1] 沿軸 1 的最小值索引: [0 2 0]
numpy.nonzero()
numpy.nonzero() 函數返回輸入數組中非零元素的索引。
實例
輸出結果為:
我們的數組是: [[30 40 0] [ 0 20 10] [50 0 60]] 調用 nonzero() 函數: (array([0, 0, 1, 1, 2, 2]), array([0, 1, 1, 2, 0, 2]))
numpy.where()
numpy.where() 函數返回輸入數組中滿足給定條件的元素的索引。
實例
輸出結果為:
我們的數組是: [[0. 1. 2.] [3. 4. 5.] [6. 7. 8.]] 大於 3 的元素的索引: (array([1, 1, 2, 2, 2]), array([1, 2, 0, 1, 2])) 使用這些索引來獲取滿足條件的元素: [4. 5. 6. 7. 8.]
numpy.extract()
numpy.extract() 函數根據某個條件從數組中抽取元素,返回滿條件的元素。
實例
輸出結果為:
我們的數組是: [[0. 1. 2.] [3. 4. 5.] [6. 7. 8.]] 按元素的條件值: [[ True False True] [False True False] [ True False True]] 使用條件提取元素: [0. 2. 4. 6. 8.]