2017-01-09 83 views
0

我有一個包含這樣的數據映射文件:改善格式錯誤的輸入格式錯誤信息?

|labels 0 0 1 0 0 0 |features 0 
|labels 1 0 0 0 0 0 |features 2 
|labels 0 0 0 1 0 0 |features 3 
|labels 0 0 0 0 0 1 |features 7 

數據與下面的代碼讀取到minibatch:

from cntk import Trainer, StreamConfiguration, text_format_minibatch_source, learning_rate_schedule, UnitType 

mb_source = text_format_minibatch_source('test_map2.txt', [ 
    StreamConfiguration('features', 1), 
    StreamConfiguration('labels', num_classes)]) 

test_minibatch = mb_source.next_minibatch(2) 

如果形成不良的輸入文件,有時你會得到一個相當神祕的錯誤信息。例如在輸入文件的最後一行的末尾缺少換行符會導致這樣的錯誤:

--------------------------------------------------------------------------- 
RuntimeError        Traceback (most recent call last) 
<ipython-input-35-2f1481ccfced> in <module>() 
----> 1 test_minibatch = mb_source.next_minibatch(2) 

C:\local\Anaconda3-4.1.1-Windows-x86_64\envs\cntk-py34\lib\site-packages\cntk\utils\swig_helper.py in wrapper(*args, **kwds) 
    56  @wraps(f) 
    57  def wrapper(*args, **kwds): 
---> 58   result = f(*args, **kwds) 
    59   map_if_possible(result) 
    60   return result 

C:\local\Anaconda3-4.1.1-Windows-x86_64\envs\cntk-py34\lib\site-packages\cntk\io\__init__.py in next_minibatch(self, minibatch_size_in_samples, input_map, device) 
    159 
    160   mb = super(MinibatchSource, self).get_next_minibatch(
--> 161     minibatch_size_in_samples, device) 
    162 
    163   if input_map: 

C:\local\Anaconda3-4.1.1-Windows-x86_64\envs\cntk-py34\lib\site-packages\cntk\cntk_py.py in get_next_minibatch(self, *args) 
    1914 
    1915  def get_next_minibatch(self, *args): 
-> 1916   return _cntk_py.MinibatchSource_get_next_minibatch(self, *args) 
    1917 MinibatchSource_swigregister = _cntk_py.MinibatchSource_swigregister 
    1918 MinibatchSource_swigregister(MinibatchSource) 

RuntimeError: Invalid chunk requested. 

有時候它可能是很難搞清楚該文件在那裏將是一個問題。是否有可能發出更具體的錯誤信息。輸入文件中的行號會很有用。

回答

2

感謝您報告此問題。我們已經創建了一個錯誤,並將努力修復閱讀器行爲不正確的輸入。