我正在使用Python,我需要找到執行以下任務的最有效方法。
任務:給定零和一的任何一維數組v,用k> = 0表示v的所有一維的子序列數。
我需要從v獲得一個二維數組w,使得:
1)shape(w)=(k,len(v)),
2)對于每一個i = 1,..,k,“ w”的第i行是一個全零的數組,但v的所有第i個子序列除外。
讓我舉個例子:假設$ v $是數組
v=[0,1,1,0,0,1,0,1,1,1]
然后k = 3并且w應該是數組
w=[[0,1,1,0,0,0,0,0,0,0],[0,0,0,0,0,1,0,0,0,0],[0,0,0,0,0,0,0,1,1,1]]
可以編寫代碼以多種方式執行此任務,例如:
import numpy as np
start=[]
end=[]
for ii in range(len(v)-1):
if (v[ii:ii+2]==[0,1]).all():
start.append(ii)
if (v[ii:ii+2]==[1,0]).all():
end.append(ii)
if len(start)>len(end):
end.append(len(v)-1)
w=np.zeros((len(start),len(v)))
for jj in range(len(start)):
w[jj,start[jj]+1:end[jj]+1]=np.ones(end[jj]-start[jj])
但是我需要在非常大的數組v上執行此任務,并且此任務是函數的一部分,然后將其進行最小化..因此,我需要它盡可能高效和快速。
因此,總而言之,我的問題是:用Python執行計算的最有效方法是什么?
參考方案
這是一種矢量化方式-
def expand_islands2D(v):
# Get start, stop of 1s islands
v1 = np.r_[0,v,0]
idx = np.flatnonzero(v1[:-1] != v1[1:])
s0,s1 = idx[::2],idx[1::2]
# Initialize 1D id array of size same as expected o/p and has
# starts and stops assigned as 1s and -1s, so that a final cumsum
# gives us the desired o/p
N,M = len(s0),len(v)
out = np.zeros(N*M,dtype=int)
# Setup starts with 1s
r = np.arange(N)*M
out[s0+r] = 1
# Setup stops with -1s
if s1[-1] == M:
out[s1[:-1]+r[:-1]] = -1
else:
out[s1+r] = -1
# Final cumsum on ID array
out2D = out.cumsum().reshape(N,-1)
return N, out2D
樣品運行-
In [105]: v
Out[105]: array([0, 1, 1, 0, 0, 1, 0, 1, 1, 1])
In [106]: k,out2D = expand_islands2D(v)
In [107]: k # number of islands
Out[107]: 3
In [108]: out2D # 2d output with 1s islands on different rows
Out[108]:
array([[0, 1, 1, 0, 0, 0, 0, 0, 0, 0],
[0, 0, 0, 0, 0, 1, 0, 0, 0, 0],
[0, 0, 0, 0, 0, 0, 0, 1, 1, 1]])
Python GPU資源利用 - python
我有一個Python腳本在某些深度學習模型上運行推理。有什么辦法可以找出GPU資源的利用率水平?例如,使用著色器,float16乘法器等。我似乎在網上找不到太多有關這些GPU資源的文檔。謝謝! 參考方案 您可以嘗試在像Renderdoc這樣的GPU分析器中運行pyxthon應用程序。它將分析您的跑步情況。您將能夠獲得有關已使用資源,已用緩沖區,不同渲染狀態上…Python sqlite3數據庫已鎖定 - python
我在Windows上使用Python 3和sqlite3。我正在開發一個使用數據庫存儲聯系人的小型應用程序。我注意到,如果應用程序被強制關閉(通過錯誤或通過任務管理器結束),則會收到sqlite3錯誤(sqlite3.OperationalError:數據庫已鎖定)。我想這是因為在應用程序關閉之前,我沒有正確關閉數據庫連接。我已經試過了: connectio…python-docx應該在空單元格已滿時返回空單元格 - python
我試圖遍歷文檔中的所有表并從中提取文本。作為中間步驟,我只是嘗試將文本打印到控制臺。我在類似的帖子中已經看過scanny提供的其他代碼,但是由于某種原因,它并沒有提供我正在解析的文檔的預期輸出可以在https://www.ontario.ca/laws/regulation/140300中找到該文檔from docx import Document from…numpy loadtxt單行/行作為列表 - python
我只有一個數據文件,例如: 1.2 2.1 3.2 我使用numpy版本1.3.0 loadtxt加載它 a,b,c = loadtxt("data.dat", usecols(0,1,2), unpack=True) 輸出是浮點數而不是數組 a = 1.2 我希望它將是: a = array([1.2]) 如果我讀取了多行文件,則該文件…Python ThreadPoolExecutor抑制異常 - python
from concurrent.futures import ThreadPoolExecutor, wait, ALL_COMPLETED def div_zero(x): print('In div_zero') return x / 0 with ThreadPoolExecutor(max_workers=4) as execut…