2011-10-15 32 views
1

我最親愛的stackoverflowers,從未知文件中提取序列化的數據

我想用異樣的訪問包含在文件中的序列化的數據,對我來說,擴展。大部分數據似乎在.st.idt文件中。

該程序是爲了在Windows上運行,並且unix file命令只給我提供了誤報。關於這些擴展的含義或者如何調查和提取其內容的任何想法?

下面我在一個長列表中提供了完整的擴展,希望有人能夠認識到它們。谷歌搜索也給我誤報。例如:.st通常用於ATARI仿真文件。

在此先感謝!

  • .cix
  • .cmp
  • .CNT
  • .dam
  • .das
  • .drf
  • .idt
  • .irc
  • .lxp
  • .mp
  • .mbr
  • 名爲.str
  • .vlf
  • .rpf
  • .ST
  • .ST
+1

有關這些文件來自何處的更多背景將有所幫助。 – blahdiblah

+0

.idt可能是導出的Windows Installer數據庫表。這有道理嗎?我在這裏檢查了其中的許多文件(http://www.file-extensions.org/search/?searchstring=idt&searchtype=2),之後用一些文件擴展名對網站進行了測試,我已經事先知道這種類型。 – mikey

回答

2

對如何處理這方面的一些一般性的建議:

  1. 解決此問題的一種方法是使用類似http://filext.com/的網站嘗試找出文件來自哪裏。這可能很困難,因爲它不像任何地方都有文件擴展標準 - 任何人都可以使用任何擴展名,所以你將會遇到很多衝突/消歧問題需要解決。
  2. 有時你會很幸運,如果你用純文本編輯器打開文件,你偶爾會看到可讀的純數據字符串數據,這可以幫助識別文件中包含的一般數據類型,從而幫助減少取決於文件的可能來源數量。例如,我經常幫助那些收到文件的人作爲電子郵件附件,其中包含擴展名,找出它使用此技術的文件類型,添加文件擴展名,然後在適當的程序中打開它。
  3. 也有像http://www.oldversion.com/這樣的網站,保留舊版本的程序,你(典型地)可以免費下載。如果您正在使用的數據是在5年前創建的專有程序中創建的,並且該程序不再可用/可從創建該程序的供應商處購買,那麼這非常有用。
  4. 一旦你很清楚哪些文件屬於哪些程序,那麼你可能會花費大量的時間去尋找關於文件結構的在線資源。如果不可用,您可以獲得原始程序的副本,但是程序不會打開您感興趣的文件,或者您仍希望原始訪問數據,然後嘗試使用以下方法生成一些樣本輸出文件數據,輸入,並去Rosetta Stone就可以了,比較你的已知文件與原始文件。
  5. 從那裏開始,您可能需要的附加知識是試圖找出編寫該軟件的語言/編譯器,這可以讓您領先使用哪些代碼庫來序列化第一個數據地點。一旦你知道了所有這些,那麼就需要閱讀關於序列化過程的任何可用文檔,然後編寫一個解串器。

這種技術無法解決的一件事是,如果您正在處理損壞/截斷的數據文件,可能很難區分它與您是否具有正確的文件結構。在這種情況下,「Rosetta Stone」技術可能會有所幫助。

根據您所談論的源軟件有多少種不同,聽起來像是一個非常大的項目。祝你好運!