2017-07-18 30 views
-2

我被公司要求專門使用卷積神經網絡來預測基於給出的診斷(ICD9代碼)規定的藥物類型(RxNorm代碼)。我會得到醫生寫的一百萬張處方。每個處方獨立於下一個。做卷積網絡來預測來自ICD9代碼的RxNorm代碼是否有意義?

所以一個例子是:110, 670, 890, BB2344 前3個項目是ICD9代碼,最後一個是輸出,RxNorm代碼。有一百萬這些。

老實說這項工作對我來說似乎是無稽之談。我不知道如何構建輸入。

診斷沒有固有的順序,也沒有時間戳。

一種診斷可能使另一種診斷更可能;但有很多例子他們都是獨立的。 (感染和傷口)ICD9編碼系統具有分層結構,使得110和120(兩種感染)的代碼都比說代碼110和890(感染和傷口)更密切相關。

基本上,我的輸入「圖像」應該是什麼樣子?或者CNN對這個問題根本沒有意義?

謝謝!

回答

-1

CNN需要輸入中的空間(或時間)相關性。這裏沒有這種東西,所以簡短的回答是不,這沒有意義。一般來說,考慮到數據的簡單性,我實際上會期望一些基本的線性模型(在一個熱點編碼數據上)/甚至基本規則導入能夠很好地工作。

「cnn-like」結構的唯一可能的用途是通過圖形CNN來利用圖本性。由於輸入中的分層結構可以被認爲是「空間」相關性。

+0

謝謝你,這是我的想法。我只是不確定,因爲ICD9代碼是分層的,所以有一些固有的結構,但這個事實似乎不適用於CNN。 – user798719

+0

然後,您可以考慮圖CNN,它基於與「常規」CNN相似的想法,並且可以使用圖形表示的數據(層次結構是樹)。 – lejlot