2011-05-26 27 views
1

我有一個完成的項目,但需要更好的性能。替代PHP的良好性能 - 字符串/文件操作

該項目的要點是我正在採取XML並將其轉換爲CSV文件。這些文件表示要加載到數據庫中的數據。

現在我正在使用PHP解壓縮包含XML的zip文件。然後我解析,轉換爲CSV,然後重新壓縮。

到現在爲止一直很好,但現在XML文件變得非常龐大。處理需要一天多一點的時間。我還在文件的某處進行一些操作,例如重新排列列和修剪。

你有什麼替代方案可以幫助我提高性能?

我想過用C++編寫這個解析器,但我不確定要採用什麼路線。有人提出了類似的問題,但我認爲這更多的是性能問題。我是否應該爲了性能而切換語言,堅持使用PHP並對其進行優化,我是否應該嘗試使此解析器平行,以便一次完成多個文件?

你會建議什麼?

+0

「要點」是一個詞? :O我認爲github只是被看中...... – 2011-05-26 00:11:04

+0

你在用什麼來解析XML文件? XML_Parser,XMLReader,SimpleXML,DOMDocument? – dqhendricks 2011-05-26 00:12:22

+0

PHP並不是最快的語言,但XML有多「巨大」?你怎麼輸入它們?使用緩衝區或將整個事物讀入內存?如果你向我們展示一些代碼,這將有所幫助。 – 2011-05-26 00:14:21

回答

0

如果PHP沒有提供你不想做的事情,你應該試試Perl,但是我懷疑,也許你在那裏做了錯誤的事情(邏輯上)。

你使用的是什麼樣的XML解析器? (最好是SAX之一......)。

而且,它會很高興看到一些代碼(你如何解析個XML ...)

+0

我將重新審視代碼並查看代碼是如何編碼的。 – 2011-05-27 17:55:11