我試圖解析使用com.databricks.spark.xml
星火XML解析
Dataset<Row> df = spark.read().format("com.databricks.spark.xml")
.option("rowTag", "row").load("../1000.xml");
df.show(10);
大型XML文件我得到的輸出如下
++ ||
++
++
我這麼想嗎?
這是我的示例XML行。
<row Id="7" PostTypeId="2" ParentId="4" CreationDate="2008-07-31T22:17:57.883" Score="316" Body="<p>An explicit cast to double isn't necessary.</p>

<pre><code>double trans = (double)trackBar1.Value/5000.0;
</code></pre>

<p>Identifying the constant as <code>5000.0</code> (or as <code>5000d</code>) is sufficient:</p>

<pre><code>double trans = trackBar1.Value/5000.0;
double trans = trackBar1.Value/5000d;
</code></pre>
" />
非常感謝。
這意味着你的XML中的數據沒有映射到柱狀結構,你的數據集是空的。 – FaigB