.NET Framework簡單處理XML數(shù)據(jù)(5)
發(fā)表時間:2024-06-05 來源:明輝站整理相關(guān)軟件相關(guān)文章人氣:
[摘要]設(shè)計XmlReadWriter類 如前面所說,XML reader和Writer是各自獨立工作的:reader只讀,writer只寫。假設(shè)你的應(yīng)用程序要管理冗長的XML文檔,且該文檔有不確定的數(shù)據(jù)。Reader提供了一個很好的方法去讀該文檔的內(nèi)容。另一方面,Writer是一個非常有用的用于創(chuàng)建...
設(shè)計XmlReadWriter類
如前面所說,XML reader和Writer是各自獨立工作的:reader只讀,writer只寫。假設(shè)你的應(yīng)用程序要管理冗長的XML文檔,且該文檔有不確定的數(shù)據(jù)。Reader提供了一個很好的方法去讀該文檔的內(nèi)容。另一方面,Writer是一個非常有用的用于創(chuàng)建XML文檔片斷工具,但是如果你想要它即能讀,又能寫,那么你就要用XMLDOM了。如果實際的XML文檔非常龐大,又會出現(xiàn)了一個問題,什么問題呢?是不是把這個XML文檔全部加載到內(nèi)存中,然后進(jìn)行讀和寫呢?讓我們先看一下怎么樣建立一個混合的流分析器用于分析大型的XMLDOM。
像一般的只讀操作一樣,用普通的XML reader去順序的訪問節(jié)點。不同的是,在讀的同時你可以用XML writer改變屬性值以及節(jié)點的內(nèi)容。你用reader去讀源文件中的每個節(jié)點,后臺的writer創(chuàng)建該節(jié)點的一個拷貝。在這個拷貝中,你可以增加一些新的節(jié)點,忽略或者編輯其它的一些節(jié)點,還可以編輯屬性的值。當(dāng)你完成修改后,你就用新的文檔替換舊的文檔。
一個簡單有效的辦法是從只讀流中拷貝節(jié)點對象到write流中,這種方法可以用XmlTextWriter類中的兩個方法:WriteAttributes方法和WriteNode方法。 WriteAttributes方法讀取當(dāng)前reader中選中的節(jié)點的所有有效的屬性,然后把屬性當(dāng)作一個單獨的string拷貝到當(dāng)前的輸出流中。同樣的,WriteNode方法用類似的方法處理除屬性節(jié)點外的其它類型的節(jié)點。圖十所示的代碼片斷演示了怎么用上述的兩個方法創(chuàng)建一個源XML文檔的拷貝,有選擇的修改某些節(jié)點。XML樹從樹根開始被訪問,但只輸出了除屬性節(jié)點類型以外的其它類型的節(jié)點。你可以把Reader和Writer整合在一個新的類中,設(shè)計一個新的接口,使它能讀寫流及訪問屬性和節(jié)點。
Figure 10 Using the WriteNode Method
XmlTextReader reader = new XmlTextReader(inputFile);
XmlTextWriter writer = new XmlTextWriter(outputFile);
// 配置 reader 和 writer
writer.Formatting = Formatting.Indented;
reader.MoveToContent();
// Write根節(jié)點
writer.WriteStartElement(reader.LocalName);
// Read and output every other node
int i=0;
while(reader.Read())
{
if (i % 2)
writer.WriteNode(reader, false);
i++;
}
// Close the root
writer.WriteEndElement();
// Close reader and writer
writer.Close();
reader.Close();
我的XmlTextReadWriter類并沒有從XmlReader或者XmlWriter類中繼承。取而代之的是另外兩個類,一個是基于只讀流(stream)的操作類,另一個是基于只寫流的操作類。XmlTextReadWriter類的方法用Reader對象讀數(shù)據(jù),寫入到Writer對象。為了適應(yīng)不同的需求,內(nèi)部的Reader和Writer 對象分別通過只讀的Reader和Writer屬性公開。圖十一列出了該類的一些方法:
Figure 11 XmlTextReadWriter Class Methods
Method
Description
AddAttributeChange
Caches all the information needed to perform a change on a node attribute. All the changes cached through this method are processed during a successive call to WriteAttributes.
Read
Simple wrapper around the internal reader’s Read method.
WriteAttributes
Specialized version of the writer’s WriteAttributes method, writes out all the attributes for the given node, taking into account all the changes cached through the AddAttributeChange method.
WriteEndDocument
Terminates the current document in the writer and closes both the reader and the writer.
WriteStartDocument
Prepares the internal writer to output the document and add a default comment text and the standard XML prolog.
這個新類有一個Read方法,它是對Reader的read方法的一個簡單的封裝。另外,它提供了WriterStartDocument和WriteEndDocument方法。它們分別初始化/釋放(finalize)了內(nèi)部Reader和writer對象,還處理所有I/O操作。在循環(huán)讀節(jié)點的同時,我們就可以直接的修改節(jié)點。出于性能的原因,要修改屬性必須先用AddAttributeChange方法聲明。對一個節(jié)點的屬性所作的所有修改都會存放在一個臨時的表中,最后,通過調(diào)用WriteAttribute方法提交修改,清除臨時表。
圖十二所示的代碼演示了客戶端用XmlTextReadWriter類在讀操作的同時修改屬性值的優(yōu)勢。在本期的msdn中提供了XmlTextReadWriter類的C#和VB源代碼下載(見本文開頭提供的鏈接)。
Figure 12 Changing Attribute Values
private void ApplyChanges(string nodeName, string attribName,
string oldVal, string newVal)
{
XmlTextReadWriter rw = new XmlTextReadWriter(InputFileName.Text,
OutputFileName.Text);
rw.WriteStartDocument(true, CommentText.Text);
// 手工修改根節(jié)點
rw.Writer.WriteStartElement(rw.Reader.LocalName);
// 開始修改屬性
// (可以修改更多節(jié)點的屬性)
rw.AddAttributeChange(nodeName, attribName, oldVal, newVal);
// 循環(huán)處理文檔
while(rw.Read())
{
switch(rw.NodeType)
{
case XmlNodeType.Element:
rw.Writer.WriteStartElement(rw.Reader.LocalName);
if (nodeName == rw.Reader.LocalName)
// 修改屬性
rw.WriteAttributes(nodeName);
else
// deep copy
rw.Writer.WriteAttributes(rw.Reader, false);
if (rw.Reader.IsEmptyElement)
rw.Writer.WriteEndElement();
break;
}
}
// Close the root tag
rw.Writer.WriteEndElement();
// Close the document and any internal resources
rw.WriteEndDocument();
}
XmlTextReadWriter類不僅可以讀XML文檔,也可以寫XML文檔。你可以它來讀XML文檔的內(nèi)容,如果需要,你還可以用它來做一些基本的更新操作。基本的更新操作在這里是指修改某個已存在的屬性的值或者某個節(jié)點的內(nèi)容,又或者是增加一個新的屬性或節(jié)點。對于更復(fù)雜的操作,最好還是用XMLDOM分析器。
總結(jié)
Reader和Writer是.NET Framework中處理XML數(shù)據(jù)的根本。它們提供了對所有XML數(shù)據(jù)訪問功能的原始的API。Reader像一個新的分析器類,它即有XMLDOM的強(qiáng)大,又有SAX的快速簡單。Writer為簡單的創(chuàng)建XML文檔而設(shè)計。雖然Reader和Writer都是.NET Framework中的一小塊,但是它們是相互獨立的API。在本文中,我們只討論了怎么樣用Reader和Writer完成一些主要的工作, 介紹了驗證分析器的原理機(jī)制,并把Reader和writer整合在一個單獨的類中。上述所有的這些類都是輕量級的,類似于游標(biāo)式的XMLDOM分析器。