的Python：優雅的代碼保存方式在列表中拆分字符串

我有一個字符串：的Python：優雅的代碼保存方式在列表中拆分字符串

mydata 
'POINT (558750.3267372231900000 6361788.0628051758000000)'

祝代碼保存方式，在列表中的數值轉換爲

(g, (x,y))

其中：

g = geometry (POINT) 
x = coordinates x 
y = coordinates y

我使用

mydata.split(" ") 
['POINT', '(558750.3267372231900000', '6361788.0628051758000000)']

但在那之後我需要使用幾行代碼來獲得x和y

來源

2012-12-06 Gianni Spear

如何在列表中存儲數據作爲點對象，勻稱提供方法來解析你的點字符串爲你http://pypi.python.org/pypi/Shapely – dm03514

v = mydata.split() 
g = v[0] 
x = float(v[1].strip('(')) 
y = float(v[2].strip(')')) 
(g, (x, y))

代碼保存沒錯，優雅與其說

來源

2012-12-06 17:45:11 Mark

使用regex：

In [59]: g,[x,y]=re.findall(r"[A-Za-z]+",mydata)[0], 
         [float(x) for x in re.findall(r"[\d+.]+",mydata)] 

In [60]: g 
Out[60]: 'POINT' 

In [61]: x 
Out[61]: 558750.3267372232 

In [62]: y 
Out[62]: 6361788.062805176

使用str.strip()和str.split()：

In [35]: mydata='POINT (558750.3267372231900000 6361788.0628051758000000)' 

In [39]: data=mydata.split(None,1) 

In [40]: data 
Out[40]: ['POINT', '(558750.3267372231900000 6361788.0628051758000000)'] 

In [41]: g,[x,y]=data[0], map(lambda x: float(x.strip("()")), data[1].split()) 

In [42]: g,x,y 
Out[42]: ('POINT', 558750.3267372232, 6361788.062805176)

來源

2012-12-06 17:46:13

循序漸進：

>>> s = 'POINT (558750.3267372231900000 6361788.0628051758000000)' 
>>> word, points = s.split(None, 1) 
>>> word 
'POINT' 
>>> points 
'(558750.3267372231900000 6361788.0628051758000000)' 
>>> points = points.strip('()').split() 
>>> points 
['558750.3267372231900000', '6361788.0628051758000000'] 
>>> x, y = (float(i) for i in points) 
>>> x 
558750.3267372232 
>>> y 
6361788.062805176

來源

2012-12-06 17:47:31

正則表達式可以饒你一些打字的位置：

In [1]: import re 

In [2]: def nice_tuple(s):              
    g, x, y, _ = re.split(' ?[()]?', s) 
    return g, tuple(map(float, (x, y))) 
    ...: 

In [3]: nice_tuple('POINT (558750.3267372231900000 6361788.0628051758000000)') 
Out[3]: ('POINT', (558750.3267372232, 6361788.062805176))

來源

2012-12-06 17:50:04

這是優雅的！ – Tengis

如果您的數據始終在正確的格式，它很容易：

>>> def parse_data(d): 
    geom, xs, ys = d.split() 
    return (geom, (float(xs[1:]), float(ys[:-1]))) 

>>> mydata 
'POINT (558750.3267372231900000 6361788.0628051758000000)' 
>>> parse_data(mydata) 
('POINT', (558750.32673722319, 6361788.0628051758))

來源

2012-12-06 17:52:49 Claudiu

found = re.match(r'([a-zA-Z]*) \(([0-9\.]*) ([0-9\.]*)\)', mydata) 
found.group(1), (float(found.group(2)), float(found.group(3)))

這可能是最短的一個，不知道優雅。

來源

2012-12-06 17:56:30 Mark

您仍然必須將'x'和'y'轉換爲'float'。 –

好點，我會添加它 – Mark

我會用.translate和.split：

In [126]: mydata = 'POINT (558750.3267372231900000 6361788.0628051758000000)' 

In [127]: mysplitdata = mydata.translate(None, '()').split() 

In [128]: mysplitdata 
Out[128]: ['POINT', '558750.3267372231900000', '6361788.0628051758000000'] 

In [129]: g,x,y = mysplitdata[0],float(mysplitdata[1]),float(mysplitdata[2]) 

In [130]: outdata = (g, (x,y)) 

In [131]: outdata 
Out[131]: ('POINT', (558750.32673722319, 6361788.0628051758))

來源

2012-12-06 18:00:12

最近我創建了蟒蛇，我幾乎做了同樣的事情的應用程序。這是我創建的用於解析wkt文件的類。

link

希望你覺得它有用。請參閱行號136瞭解使用情況。您也可以使用此類讀取Linestrings和Multilinestrings。

來源

2012-12-06 18:02:17

的Python：優雅的代碼保存方式在列表中拆分字符串

回答

相關問題