解讀Asp.Net 建立的在線 RSS 新聞聚合器_.Net教程
推薦:淺談ASP.NET兩個截取字符串的實用方法技巧兩個截取字符串的實用方法(超過一定長度自動換行) 1/**//// 2 /// 截取字符串,不限制字符串長度 3 /// 4 /// 待截取的字符串 5 /// 每行的長度,多于這個長度自動換行 6 /// 7 public string CutStr(string str,int len) 8 { string s=
我們面臨的下一個任務(wù)是創(chuàng)建 DisplayNewsItems.aspx 頁面。這個頁面會以鏈接的形式顯示所選聚合摘要的新聞項標(biāo)題,當(dāng)點擊標(biāo)題時,新聞的內(nèi)容就會顯示在右下部分的框架中。要完成這一任務(wù),我們會面臨以下兩個主要的挑戰(zhàn):
·通過指定的 URL 訪問 RSS 聚合摘要;
·將接收到的 XML 數(shù)據(jù)轉(zhuǎn)換為相應(yīng)的 HTML;
幸運的是,在.NET 框架中,要實現(xiàn)這兩個任務(wù)都不是很難。對于第一個任務(wù),只需要兩行代碼,我們就可以將遠程的xml數(shù)據(jù)裝載到一個XmlDocument對象中。而第二個任務(wù)呢, 借助 ASP.NET XML Web 控件在ASP.NET 頁面中顯示XML數(shù)據(jù)也比較容易。
XML Web 控件被設(shè)計用于在 Web 頁面中顯示原始或者轉(zhuǎn)換過的 XML 數(shù)據(jù)。使用 XML Web 控件的第一步是定義XML數(shù)據(jù)源,通過 定義一系列的屬性,用許多方法都可以完成這一工作。使用 Document屬性,你可以指定一個 XmlDocument 實例作為 XML Web 控件的 XML 數(shù)據(jù)源。如果XML數(shù)據(jù)存在于 Web 服務(wù)器文件系統(tǒng)的一個文件中,可以用 DocumentSource 屬性,只要提供該 XML 文件的相對或者絕對路徑就可以了。最后,如果你 的 XML數(shù)據(jù)是一個字符串,那么你可以將這個字符串的內(nèi)容賦給控件的 DocumentContent 屬性。這三種辦法都可以將 XML 數(shù)據(jù)與 XML 控件聯(lián)系起來。
通常,在將 XML 數(shù)據(jù)顯示到 Web 頁面之前,我們會以某種方式轉(zhuǎn)換 XML 數(shù)據(jù)。XML Web 控件允許我們指定一個 XSLT 樣式表來做這個轉(zhuǎn)換工作。與 XML 數(shù)據(jù)相似,XSLT 樣式表可以通過 兩個屬性之一,以兩種不同的方式中的一種來設(shè)置,一是 Transform 屬性可被賦值給 XslTransform 實例,二是將本地 Web 服務(wù)器上 XSLT文件的 相對或絕對路徑賦予 TransformSource 屬性。
現(xiàn)在我們來創(chuàng)建 DisplayNewsItems.aspx 頁面。在添加 XML Web 控件以及編寫后臺代碼類之前,我們需要在 HTML 部分加入一小段客戶端 JavaScript 代碼。準確地說,是在 html 部分的 <head> 標(biāo)簽里面 添加如下的<script>代碼塊:
<script language="javascript">
// display a blank page in the bottom frame when the news items loads
parent.rbottom.location.href = "about:blank";
</script>
每當(dāng) DisplayNewsItems.aspx 頁面裝載的時候,這段客戶端 JavaScript 代碼會在右下角的框架中顯示一個空白頁。為了理解為什么要加入這段代碼,我們來看看省略這段代碼,我們會碰到什么情況:
·用戶在左邊的框架中點擊聚合摘要,瀏覽器會在右上部的框架中裝載摘要新聞項;
·用戶在右上部框架中點擊某個新聞項,瀏覽器會在右下部框架中裝載這個新聞項 的詳細內(nèi)容;
現(xiàn)在用戶在左邊的框架中點擊其它的聚合摘要,瀏覽器會在右上部分的框架中裝載新的摘要新聞項;
前一個新聞項的詳細內(nèi)容還顯示在右下部的框架中!通過上面的客戶端 Javascript 代碼,每次點擊左面框架的摘要便可以清除右下部框架 的內(nèi)容,以消除這一瑕疵。
在我們處理了客戶端代碼的問題之后,讓我們把注意力轉(zhuǎn)到添加 XML Web 控件。一旦加入 XML Web 控件,將其 ID 屬性設(shè)置為 xsltNewsItems,TransformSourc 屬性設(shè)置為 NewsItems.xslt(我們將要創(chuàng)建的 XSLT 樣式表文件的名稱)�,F(xiàn)在,在 Page_Load 事件處理函數(shù)中,我們需要 在某個 XmlDocument 實例中獲取遠程 RSS 聚合文件,然后將該 XML Web 控件的 Document 屬性賦給該 XmlDocument 實例。
在 Page_Load 事件處理函數(shù)中,與我們要實現(xiàn)的任務(wù)有密切關(guān)系的代碼是最后三行代碼。這三行代碼創(chuàng)建一個新的 XmlDocument 對象, 加載遠程 RSS 摘要內(nèi)容,然后將這個 XmlDocument 對象賦給 XML Web 控件的 Document 屬性。訪問遠程 XML 數(shù)據(jù)并 將它們顯示在 ASP.NET 頁面中就是這么簡單,難道給你留下的印象不深嗎?
剩下我們要做的一件事就是創(chuàng)建 XSLT 樣式表,NewsItems.aspx。下面是樣式表的第一版的草稿:
<?xml version="1.0" encoding="UTF-8" ?>
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="html" omit-xml-declaration="yes" />
<xsl:template match="/rss/channel">
<b><xsl:value-of select="title"
disable-output-escaping="yes" /></b>
<xsl:for-each select="item">
<li>
<a>
<xsl:attribute name="href">
DisplayItem.aspx?ID=<xsl:number value="position()" />
</xsl:attribute>
<xsl:attribute name="target">rbottom</xsl:attribute>
<xsl:value-of select="title"
disable-output-escaping="yes" />
</a>
(<xsl:value-of select="pubDate" />)
</li>
</xsl:for-each>
</xsl:template>
</xsl:stylesheet>
這個XSLT樣式表只有一個模版,用于匹配“/rss/channel”XPath表達式。這個模版先是以粗體顯示<title>元素的內(nèi)容。然后,循環(huán)獲取每一個<item>元素,對于每一個元素,顯示一個到 DisplayItem.aspx 頁面的超鏈接,在查詢字符串中傳遞<item>元素的位置屬性。要留意超鏈接的 target 屬性設(shè)置為 rbottom,右下部框架的名稱。最后,顯示每一個新聞項的標(biāo)題和<pubDate>元素。
該 XSLT 樣式表中有兩個項目,并不是每個人都熟悉。首先是 <xsl:value-of> 元素中的 disable-output-escaping="yes" 屬性。從本質(zhì)上講,這個屬性的設(shè)置通知 XSLT 引擎不要轉(zhuǎn)義那些非法的 XML 字符,比如:&, < , >, " 和 ’’。為了理解這個設(shè)置的意義,就要知道,如果不設(shè)置該屬性(也就是設(shè)置為默認值"no"),那么如果標(biāo)題包含一個轉(zhuǎn)義的&字符&,那么輸出的 html 文件中也會有一個&,而不單單是一個字符&。如果你再仔細想一想,你會發(fā)現(xiàn)這種情況會導(dǎo)致很多問題。例如,假設(shè)一個聚合文件的標(biāo)題是“Matt’’s Cool Blog”,如果輸出轉(zhuǎn)義沒有被禁止,那么輸出就會保留 “Matt’’s Cool Blog”,在 Web 頁面就會顯示為 "Matt’’s <i>Cool</i> Blog"。當(dāng)用 disable-output-escaping="yes"設(shè)置禁止輸出轉(zhuǎn)義時,輸出就不會被轉(zhuǎn)義,上面的內(nèi)容就會被當(dāng)作“Matt’’s <i>Cool</i> Blog”,顯示在頁面上就是我們想要的“Matt’’s Cool Blog”。
另一個要注意的是元素<a>。這個奇怪的語法會生成下面的輸出內(nèi)容:
<a href="DisplayItem.aspx?ID=position">news item title</a>
之所以要使用這種語法,是因為要給 XSLT 樣式表中某個你要創(chuàng)建的元素添加一個屬性,然后在該元素的標(biāo)簽里使用 <xsl:attribute> 語法 。有關(guān)該語法的一些例子可在 W3Schools 網(wǎng)站上找到:The <xsl:attribute> Element。
最后要注意的是,超鏈接的ID查詢字符串的值是來自于 <xsl:number> 元素,從 position() 函數(shù)中返回的值。<xsl:number> 元素僅僅是輸出一個數(shù)值。position()函數(shù)是一個 XPath 函數(shù),用來返回 XML 文檔中當(dāng)前節(jié)點的順序位置。這意味著對于第一個新聞項,position() 函數(shù)返回 1,第二個 新聞項,position函數(shù)返回 2,以此類推。我們需要記錄這個值并將它通過查詢字符串傳遞出去。這樣當(dāng) DisplayItem.asp 頁面被訪問時,就可以知道顯示 RSS 聚合摘要的什么項目了。
聰明的讀者可能已經(jīng)注意到,我們的 XSLT 樣式表沒有全部完成,因為 FeedID 參數(shù)沒有通過查詢字符串傳遞到 DisplayItem.aspx 頁面。要明白 這是為什么,我們回顧一下在 ID 查詢串參數(shù)中所傳遞的是用戶擬察看詳細信息的<item>元素順序號。也就是說,如果用戶點擊第四條新聞項,頁面 DisplayItem.aspx?ID=4 就會被 加載到右下部分的框架中。問題在于 DisplayItem.aspx 頁面無法確定用戶希望查看哪一個摘要。有兩個不同的方法可以解決這個問題,比如可以在右下部框架中用客戶端 Javascript 代碼讀取右上部框架的 URL,然后確定FeedID 的值。在我看來,更簡單的辦法是和 ID 參數(shù)一起將 FeedID 的值通過查詢字符串傳遞 。
這樣的話,有一個難題是 XSLT 樣式表操縱的 RSS XML 數(shù)據(jù)中并沒有 FeedID 值。但是 DisplayNewsItems.aspx 頁面知道 FeedID 值,需要一種方法讓 XSLT 樣式表也知道這個值。通過使用 XSLT參數(shù)可以 實現(xiàn)完成。
XSLT 參數(shù)的使用是非常簡單。在 XSLT 樣式表中,你需要在 <xsl:template> 元素中加入一個<xsl:param> 元素, 該元素提供參數(shù)的名稱。下面的代碼將這個參數(shù)命名為 FeedID:
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:template match="/rss/channel">
<xsl:param name="FeedID" />
...
</xsl:template>
</xsl:stylesheet>
現(xiàn)在,就可以用下面的語法在<xsl:value-of>元素中使用這個參數(shù)了:
<xsl:value-of select="$parameterName" />
最后,在我們的 XSLT 樣式表中加入下面的代碼,我們就可以把 FeedID 查詢字符串參數(shù)加到超鏈接中了:
<a>
<xsl:attribute name="href">DisplayItem.aspx?ID=<xsl:number value="position()" />&FeedID=<xsl:value-of select="$FeedID"
/></xsl:attribute>
注意在ID查詢字符串參數(shù)后面我們加了一個&字符(轉(zhuǎn)義&),這樣我們就可以傳遞 FeedID 參數(shù)的值到查詢字符串的 FeedID 參數(shù)中了。 這就是我們要在 XSLT 樣式表中添加的內(nèi)容。
剩下的工作是在 DisplayNewsItems.aspx 頁面的 Page_Load 事件處理函數(shù)中設(shè)置這個參數(shù)的值。通過使用 XsltArgumentList 類可以完成這一工作。這個類有一個 AddParameter() 方法。一旦我們創(chuàng)建了這個類的一個實例,加入了相應(yīng)的參數(shù),就可以將這個 實例賦給 XML Web 控件的 TransformArgumentList 參數(shù)了。下面的代碼顯示了更新后的 DisplayNewsItems.aspx 頁面 Page_Load 事件處理函數(shù):
顯示特定新聞項的詳細內(nèi)容
還剩下最后一件需要做的事情是顯示用戶選擇的特定新聞項的詳細內(nèi)容。這些詳細內(nèi)容將顯示在右下部的框架中,而且將會顯示新聞項的標(biāo)題,描述和新聞項的鏈接等信息。和 DisplayNewsItem.aspx 頁面 類似,DisplayItem.aspx 頁面首先將根據(jù)傳入的 FeedID 查詢字符串參數(shù)獲取遠程的 RSS 聚合摘要,然后它會用 XML Web 控件顯示這些詳細內(nèi)容。實際上,DisplayItem.aspx 頁面的 Page_Load 事件處理函數(shù)和DisplayNewsItem.aspx 頁面的 該函數(shù)幾乎一樣,只有以下兩個小小的區(qū)別:
·DisplayItem.aspx 頁面需要讀取ID查詢字符串參數(shù)的值;
·DisplayItem.aspx 頁面使用一個 XSLT 參數(shù),但是這個參數(shù)與 DisplayNewsItem.aspx 頁面用的參數(shù)是不一樣的;
DisplayNewsItem.aspx 和 DisplayItem.aspx 頁面一樣都需要在參數(shù)中傳遞一個 XSLT 樣式表。DisplayNewsItem.aspx 頁面?zhèn)鬟f的是 參數(shù) FeedID,而 DisplayItem.aspx 還需要傳入 ID 參數(shù),它表示 XSLT 樣式表應(yīng)該顯示那個新聞項。這個細小的差別在以下代碼中以粗體顯示,以下 代碼省略了與 DisplayNewsItems.aspx 頁面相同的部分:
以下是轉(zhuǎn)換 XML 數(shù)據(jù)的 XSLT 樣式表:
<?xml version="1.0" encoding="UTF-8" ?>
<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="html" omit-xml-declaration="yes" />
<xsl:param name="ID" />
<xsl:template match="/rss/channel">
<b><xsl:value-of select="item[$ID]/title"
disable-output-escaping="yes" /></b>
<p>
<xsl:value-of select="item[$ID]/description"
disable-output-escaping="yes" />
</p>
<a>
<xsl:attribute name="href"><xsl:value-of
select="item[$ID]/link" /></xsl:attribute>
<xsl:attribute name="target">_blank</xsl:attribute>
Read More...
</a>
</xsl:template>
</xsl:stylesheet>
注意 <xsl:param> 元素被用于聲明 ID XSLT 參數(shù)。然后,在幾個不同的 <xsl:value-of> 元素中,ID 參數(shù) 被用來從 <item> 元素列表中抓取特定的 <item> 元素。在 XPath 的語法中,elementName[i]意思是根據(jù)相應(yīng)元素名 存取第i個元素。例如,item[1]將只獲取第一個<item>元素,item[2]則獲取第二個元素。所以 item[$ID]是獲取由 XSLT 參數(shù) ID 定義的 特定 <item> 元素。
最后,值得注意的還有在樣式表靠近末尾部分的超鏈接 Read More…,它的target屬性設(shè)為空,這樣的話當(dāng)用戶點擊 Read More… 鏈接的時候,瀏覽器會打開一個新的窗口。
未來的擴展和當(dāng)前程序的缺點
本文講述的代碼中有一個明顯的缺點就是每次用戶點擊左邊框架的某個聚合摘要或者在右上部框架點擊某個新聞項時,遠程聚合摘要都會被裝載和解析。每次用戶點擊遠程聚合 摘要時,所有的項都被加載,這樣的效率無疑是很差的。每次用戶點擊一個新聞項標(biāo)題就重新裝載整個遠程聚合摘要也是很浪費資源的。這樣的方法不僅沒有效率,對提供發(fā)布服務(wù)的個人或者公司也是不禮貌的,因為這些 連續(xù)的、不沒必要的請求占用了他們的 Web 服務(wù)器的負載資源。
這個缺點在本文附帶的源代碼中已經(jīng)得到解決。具體來說,.NET數(shù)據(jù)緩存可以用來存放不同摘要的 XmlDocument 對象。緩存間隔設(shè)置為數(shù)據(jù)表 Feeds 中 UpdateInterval 字段定義的值。(當(dāng)然,由于某些原因,摘要的 XmlDocument 對象有可能會被提前清除出緩存)
這個系統(tǒng)的另外一個缺點是在右上部框架和右下部框架之間沒有狀態(tài)的保存。為了說明這樣會引起什么問題,考慮以下的動作:
·用戶點擊左邊框架的某個聚合摘要鏈接,在右上部框架中裝載這個摘要的新聞項目。假設(shè)這個摘要的UpdateInterval 的值是30,則表示這些內(nèi)容在30分鐘之 后會過期;
·裝載右上部框架的新聞項的同時,這些內(nèi)容被緩存起來;
·用戶離開去吃午飯;
·發(fā)布聚合內(nèi)容的網(wǎng)站增加了一條新的新聞項;
·我們的用戶一個小時午飯后回來了,這個 摘要的 XmlDocument 的緩存已經(jīng)過期;
·用戶點擊右上部框架的第一條新聞項,將會在右下部分框架中裝載 DisplayItem.aspx,傳入 ID 參數(shù)值1;
·DisplayItem.aspx 頁面在緩存中沒找到 XmlDocument 對象,只好重新獲取遠程摘要。這樣就會獲得新的數(shù)據(jù)了(別忘了,步驟 4 已經(jīng)加了一個新的新聞項),然后此頁面會顯示第一條新聞項目(因為ID參數(shù)的值為1) ;
·用戶看到了新的新聞項,但是內(nèi)容會令他感到有點困惑,因為已經(jīng)不是他所點擊的那一條新聞了,而且右上部也沒有顯示那條新的新聞。
之所以出現(xiàn)這樣的問題,是因為 ID 參數(shù)沒有唯一地標(biāo)識一個新聞項,它只是一個特定時間點上新聞項列表中的一個偏移量。解決這個問題的一個好的方法是不要用數(shù)據(jù)緩存來保存聚合 摘要,而是使用數(shù)據(jù)庫或者持久介質(zhì)的其它方式(比如 Web 服務(wù)器本地文件系統(tǒng)的 XML 文件)。如果使用數(shù)據(jù)庫,每一個新聞項都可以擁有一個唯一的標(biāo)識號,可以用來傳遞到右下角的框架中。這種方法可以保證解決上面提到的問題。當(dāng)然也會增加系統(tǒng)的復(fù)雜性,比如需要決定何時從數(shù)據(jù)庫中清除掉舊的新聞項 。
本文現(xiàn)有的應(yīng)用程序還缺少異常處理,而這肯定是應(yīng)該加上的。尤其是當(dāng)從遠程 RSS 聚合摘要文件獲取數(shù)據(jù)并加載到 XmlDocument 對象時,應(yīng)該加上異常處理。因為遠程的文件可能不存在或者格式不正確。
還有很多增強功能可以輕松地加入到這個在線新聞聚合器。一個明顯的功能是需要一個管理頁面來允許用戶添加,刪除和編輯他們現(xiàn)在的聚合摘要。還有,如果能允許用戶自定義分類 ,將他們的聚合摘要按類別放在一起就更好了。另外,現(xiàn)在的用戶界面還是比較粗糙的,但是通過增加一些 XSLT 樣式表生成的 HTML 代碼或者在幾個框架里面增加一些樣式表就可以很容易地美化一下界面。最后,在html標(biāo)簽里面加一些<meta>元素,可以讓右上部框架定時地去刷新,使得用戶不用自己手工去刷新頁面就可以看到最新的新聞項目。
注解 (2003年8月4日): 在這篇文章發(fā)布以后,一些讀者用 Email 告訴通知我在顯示特定 RSS 聚合項的 <description> 元素時,有兩個潛在的問題:
1、Disable-output-encoding 屬性,這個屬性用在 <xsl:value-of> 元素中,但是并不是所有的 XSLT解析器都實現(xiàn)了這個功能。.NET XSLT 解析器支持 disable-output-encoding,但是還是要 注意一下,因為讀者可能試圖將這個應(yīng)用程序移植到其它平臺。
2、<description> 元素的 HTML 內(nèi)容是被原封不動地輸出的。但是,這些 HTML 內(nèi)容可能包含惡意代碼,比如 <script> 或者 <embed> 代碼塊。理想情況下,這些代碼應(yīng)該被剔除掉。為了清除掉這些有潛在危險的代碼,可能需要用到一些擴展函數(shù)(參見 Extending XSLT with JScript, C#, and Visual Basic .NET)。想查看從 RSS 聚合 摘要剔除 HTML 內(nèi)容的更多信息,可以參見’’Dive Into Mark’’ 日志.
總結(jié)
在本文中,我們不僅講到如何創(chuàng)建一個聚合引擎,還創(chuàng)建了一個在線新聞聚合器。在建立這兩個應(yīng)用程序時,我們都采用了在 ASP.NET 頁面顯示 XML 數(shù)據(jù)的技術(shù)。在聚合引擎里面,我們使用了 Repeater 控件以 XML格式來顯示數(shù)據(jù)庫中的數(shù)據(jù)。而在新聞聚合器里面,我們使用了 XML Web 控件和 XSLT 樣式表。
我邀請你下載本文的在線新聞聚合器,然后根據(jù)你的需要來增強它。如果有任何關(guān)于這個應(yīng)用程序或者這篇文章討論的概念方面的問題,隨時恭候你的 EMail。我的 EMail [email protected].
分享:怎樣在ASP.NET項目里面正確使用Linq to Sql老久不上來寫技術(shù)類的東西了,偶爾回歸一下吧。(其實,這篇文章8個月前寫了個大半,后來一直沒有時間去完善,再后來就因為各種原因給放下來了。) Linq to Sql 用的人也應(yīng)該有些吧,我在cnblogs上面看老趙寫的那幾篇文章(請看08年9月左右的文章),感覺也很有
- asp.net如何得到GRIDVIEW中某行某列值的方法
- .net SMTP發(fā)送Email實例(可帶附件)
- js實現(xiàn)廣告漂浮效果的小例子
- asp.net Repeater 數(shù)據(jù)綁定的具體實現(xiàn)
- Asp.Net 無刷新文件上傳并顯示進度條的實現(xiàn)方法及思路
- Asp.net獲取客戶端IP常見代碼存在的偽造IP問題探討
- VS2010 水晶報表的使用方法
- ASP.NET中操作SQL數(shù)據(jù)庫(連接字符串的配置及獲取)
- asp.net頁面?zhèn)髦禍y試實例代碼
- DataGridView - DataGridViewCheckBoxCell的使用介紹
- asp.net中javascript的引用(直接引入和間接引入)
- 三層+存儲過程實現(xiàn)分頁示例代碼
- 相關(guān)鏈接:
- 教程說明:
.Net教程-解讀Asp.Net 建立的在線 RSS 新聞聚合器
。