2016-03-30 129 views
1

我一直在反彈這個問題的一些想法,但認爲我會諮詢在線社區,看看是否有更好的選擇。使用python進行階躍函數分析

所以我有階梯狀的函數圖形是這樣的:

step-1 graph

step-2 graph

step-3 graph

而與此我想計算步驟之間的y位移。

正如人們所看到的,這些步驟並不是完全水平的,而是在升級之前取一小部分y值。

所以,問題是:

(1)什麼是「正確」的方式(如果有的話),每次取「水平」的平均y值?我不確定我應該在哪裏使用我最左邊的點和最右邊的每個點 - 所以我可以將這些點之間的數值取平均值,然後達到每個級別的「平均值」,希望這可以使得感。正如人們所看到的,它們並不全都在x中位移相同。最終目標是獲得水平之間的y位移,一旦我獲得每個「水平」的「平均」值,取得差異是微不足道的。

我可能正在考慮採用曲線的導數,並且在每個關卡的左右兩個點上看到其等於零的位置,但我不確定它會起作用,因爲每個關卡都包含點( dy/dx = 0) - 所以我可以使用一些見解。

謝謝:)噢 - 這必須在Python中完成 - 它不僅僅是這些圖形,而且它們中的很多具有類似的風格,所以代碼必須足夠通用以處理其他類似步驟圖表。

日期文件圖1:http://textuploader.com/5nwsh

數據文件圖2:http://textuploader.com/5nwsv

數據文件圖3:http://textuploader.com/5nwsj

散點圖Python代碼:

import numpy as np 
import matplotlib.pyplot as plt 
import pylab as pl 


data=np.loadtxt('data-file') 
x= data[:,0] 
y=data[:,1] 


pl.plot(data[:,0],data[:,1],'r') 

pl.xlabel('x') 
pl.ylabel('y') 
plt.show() 
+0

@ roadrunner66難道沒關係,如果我們傾斜或不?水平之間的差異將是相同的Y位移? – Scientized

+0

我相信你的解決方案應該放在你想要了解的物理現實的模型中。例如。你想旋轉圖形首先與x和y對齊還是當前座標系統是你需要的座標系統?如果這些步驟非常週期,則FFT可能是測試周期性的一種方式。衍生工具將允許您通過設置偏移量來消除傾斜度,使得大多數點的平均值爲零,如您所述。 – roadrunner66

+0

否。如果您將圖形傾斜爲近似水平,則「y軸」中不會出現「step」。所以需要對步驟進行定義,我認爲您的意思是,圖形以類似於樓梯的方式傾斜,就像在第二張圖中一樣。 – roadrunner66

回答

2

讓我們假設您的數據是晶體表面的AFM測量結果(所有單位均爲m),並且您希望獲得臺階高度的晶體。以下將幫助你達成目標。

from __future__ import division 
from ipywidgets import * 
import numpy as np 
import matplotlib.pyplot as p 
%matplotlib inline 

def rotatedata(x,y,a): 
    cosa=np.cos(a) 
    sina=np.sin(a) 
    x = x*cosa-y*sina 
    y = x*sina+y*cosa 
    return x,y 

data=np.loadtxt('plot3.txt') 
data=data.T 
x,y=data[0],data[1] 

def workit(a2): 
    fig=p.figure(num=None, figsize=(18, 16), dpi= 80, facecolor='w', edgecolor='k') 
    p.subplot(511) # , aspect='equal') 
    p.plot(x,y) 

    #what is the slope? 
    m,b = np.polyfit(x, y, 1) 

    x1,y1=rotatedata(x,y, -np.arctan(m)) # rotate data to have flat surface, 
              # interesting for surface roughness 
    p.subplot(512) 
    p.plot(x1,y1) 

    x2,y2=rotatedata(x,y, a2) # rotate data to 'sharpen' histogram 
    p.subplot(513) 
    p.plot(x2,y2) 

    p.subplot(514) 
    p.hist(y2,bins=130)   

    y3=np.diff(y2) 
    p.subplot(515) 
    p.plot(y3) 

    return HTML() 

interact(workit,a2=[-0.002,0.002,0.00001]) 

enter image description here

第一個情節是原始數據。在第二個圖中,我刪除了數據的斜率,以顯示如果您關心計算表面粗糙度的情況下將使用的數據。

第三個圖顯示相同的數據,如果它們旋轉使得所有斜坡都是水平的。

這是如何完成的(交互式滑塊)顯示在第4個圖中,它是旋轉數據的直方圖。您可以簡單地移動滑塊(旋轉數據),直到直方圖具有最大銳度(所有最大值都是最小寬度)。 我用手做了這個(滑塊)沒有一個函數,但有一個簡單的autofocus例程,最大化相鄰值之間絕對差值的總和可以使用。

在最後一個圖中,我顯示了一階導數(現在是多餘的,但水平區域的平均斜率應該以零爲中心作爲一個雙重檢查)。

水晶層的寬度(您要求的高度)現在由直方圖中最大值的距離給出。

我將每個步驟的實際測定結果作爲練習(例如閾值直方圖,然後計算每個峯的重心,然後獲得相鄰峯重心的差異)。

+0

雅,這看起來不錯 - 謝謝:)我一直在嘗試實現直方圖的自動對焦,但我有點卡住 - 任何建議? – Scientized

+0

另外,我怎麼能閾值的直方圖? – Scientized

+1

閾值處理意味着您可以刪除某個級別以下的所有值,您可以使用循環來執行這些操作,或者更優雅地使用numpy構造,如:aa [aa <3.5e-9] = 0。稍後我會看一下'autofocus',但是自己嘗試一下,比如在直方圖中對所有連續值的差值進行絕對值平方和。當直方圖非常尖銳時,此度量應該達到峯值。 – roadrunner66

0

這裏的第二步是自動調整直方圖。我定義了一個函數focus,它告訴我sharp直方圖是如何使用該函數來查找給出最清晰直方圖的角度的。然後我選擇該角度,對直方圖進行閾值並找出每個直方圖峯值的重心。這些地點之間的差異是步驟。如果這些數字以米爲單位,那麼步長約爲4埃。事實證明,在二維平面AFM或白光干涉儀數據中可以使用同樣的想法,並且非常精確地確定階梯高度,不僅僅是晶體,而是納米級塗層或蝕刻深度。

from __future__ import division 
from ipywidgets import * 
import numpy as np 
import matplotlib.pyplot as p 
%matplotlib inline 

def rotatedata(x,y,a): 
    cosa=np.cos(a) 
    sina=np.sin(a) 
    x = x*cosa-y*sina 
    y = x*sina+y*cosa 
    return x,y 


data=np.loadtxt('plot3.txt') 
data=data.T 
x,y=data[0],data[1] 

def rotateAndCheck(a2): 
    x2,y2=rotatedata(x,y, a2) 
    vals,edges=np.histogram(y2,bins=230) 
    focus=np.sqrt(np.sum((np.diff(vals))**2)) 
    return focus 

focus=[] 
amin,amax,astep=-0.01,0.01,0.0001 
for i in np.arange(amin,amax,astep): 
    focus.append(rotateAndCheck(i)) 


fig=p.figure(num=None, figsize=(18, 16), dpi= 80, facecolor='w', edgecolor='k') 


p.subplot(311)  

p.plot(focus,'.-') 
nm=np.argmax(focus) 
angle=amin+astep*nm 


p.subplot(312) 
x2,y2=rotatedata(x,y, angle) 
vals,edges,_=p.hist(y2,bins=230) 


#now threshold 
p.subplot(313) 
vals[vals<3]=0 
#print len(edges),len(vals) 
deltaedge=edges[1]-edges[0] 
#print deltaedge 
#p.bar(edges[:-1],vals,0.05e-10) 
p.bar(np.arange(len(vals)),vals,0.05e-10) 
p.show() 

# now you go through the histogram from left to right, identify each group and compute the center of gravity for each group 
# this could get trickier if the bin size is not well chosen. 

from scipy.ndimage.measurements import center_of_mass 
levels=[] 

for i in range(1,len(edges)-2): 
    if vals[i-1]==0 and vals[i]>0: 
     istart=i 
     #print 'istart: ',istart 
    if vals[i]>0 and vals[i+1]==0: 
     istop=i 
     #print 'istop', istop 
     sum=np.sum(vals[istart:istop+1]) 
     c= center_of_mass(vals[istart:istop+1])[0] 
     level= edges[istart]+c*deltaedge 
     levels.append(level) 

     #print i, sum 

print 'levels: ',levels   
print 
print 'steps: ' ,np.diff(levels) 

輸出: enter image description here

+0

你知道它爲什麼總是省略最後一級嗎?在你的組織中顯然有10個組,但只有9個級別的數組輸入 - 我在其他示例中也有相同的問題 – Scientized

+0

它排除了第一個。我認爲這是因爲左邊沒有零倉。這可能是固定的。 – roadrunner66