我正在處理髮布的表單數據分析的星型模式。表單數據將發佈到的網站實際上是託管表單的網站的外部,因此只有表單中的數據可用。我想給的選項包括與隱藏字段,原來的引薦,會話ID等一些額外的有用的信息名稱值對和事實表
我就可以使用正則表達式匹配特定的數據類型,和他們拉出來的具體尺寸例如郵政編碼。
我有一個解決方案,以應對尺寸的任意性,它不是一個偉大的,但它會奏效。
,我的問題是,我不知道會是在我的事實表,它不喜歡的有,我可以聚集一個不錯的數值。除了符合這些標準的「是的,有一個表格帖子」的事實。
我想知道我是否以正確的方式接近這一點?我是否使用錯誤的工具來完成這項工作?或者我只是想念一些東西?
Simon。
進一步細節:
有兩個功能域,例如濾波形式帖依賴於標準在兩個時間戳之間。但是就過濾而言,幾乎任何東西都可以抓住。選定的表單文章將被用於生成一個csv文件以便導出。
另一個主要領域是分析,研究將廣告支出轉化爲客戶線索是一個明顯的起點。也有些開放式,取決於表單數據。
對問題域和問題(數據預期顯示的內容)提出更好的想法將有助於回答問題。 – 2008-11-18 13:09:11