2012-11-12 90 views
4

安裝最新版本0.9.0熊貓的情況下,這是一個錯誤。編輯:忘了提及這是Python 2.7。 試圖讀取Excel文件。這部分似乎沒問題。 本來,我是想iteritems()爲大熊貓數據幀中的每一行,作爲id_company了對MySQL數據庫進行驗證(不包括代碼)。相同/相似的錯誤消息將其放入一個元組(代碼如下)。錯誤消息如下。大熊貓重建索引只與唯一價值指數的有效對象

注意有一個.reindex(),但它沒有工作之前,無論是。 reindex()是一種雹子。

作爲一種變通,我可能會簡單地從我的目標SQL導入並做加盟。我擔心這是因爲數據集的大小。

import pandas as pd 
def runNow(): 
    #identify sheet 
    source = 'C:\Users\jlalonde\Desktop\startup_geno\startupgenome_w_id_xl_20121109.xlsx' 
    xls_file = pd.ExcelFile(source) 
    sd = xls_file.parse('Sheet1') 
    source_u = sd.drop_duplicates(cols = 'id_company', take_last=False) 
    source_r = source_u[['id_company','id_good','description', 'website','keyword', 'company_name','founded_month', 'founded_year', 'description']] 
    source_i = source_r.reindex() #hail mary 
    tup_r = [tuple(x) for x in source_i.values] 

以下是錯誤:

Traceback (most recent call last): 
    File "<pyshell#10>", line 1, in <module> 
    sg_sql_2.runNow() 
    File "sg_sql_2.py", line 31, in runNow 
    tup_r = [tuple(x) for x in source_r.values] 
    File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 1443, in as_matrix 
    return self._data.as_matrix(columns).T 
    File "C:\Python27\lib\site-packages\pandas\core\internals.py", line 723, in as_matrix 
    mat = self._interleave(self.items) 
    File "C:\Python27\lib\site-packages\pandas\core\internals.py", line 743, in _interleave 
    indexer = items.get_indexer(block.items) 
    File "C:\Python27\lib\site-packages\pandas\core\index.py", line 748, in get_indexer 
    raise Exception('Reindexing only valid with uniquely valued Index ' 
Exception: Reindexing only valid with uniquely valued Index objects 

所以,對於這個敲打我的頭靠在牆上一天的大部分時間後,誰能告訴我,如果這是一個錯誤,或者如果我我錯過了真正明顯的東西?

+0

可能的重複數據刪除:http://stackoverflow.com/questions/13292944/resample-non-unique-time-indexes-in-python。你有沒有可以用來重現錯誤的例子? – Garrett

+0

我可以發佈excel文件沒問題。不,這不是重複的,因爲我有一個唯一索引和其他鏈接索引被複制......雖然該解決方案可以是相同的.... –

+0

GitHub的問題跟蹤此錯誤:https://github.com/pydata /熊貓/問題/ 2236 – Garrett

回答

相關問題