因為我的前段時間發(fā)的XMLHTTP批量抓取遠(yuǎn)程資料的文章 http://blog.csdn.net/babyt/archive/2004/09/08/98516.aspx 最近有人來問我如何將文章用文本格式保存,而不是直接使用HTML存儲,這樣的話會節(jié)約數(shù)據(jù)庫空間.于是寫了這么個函數(shù)來將文本中的HTML標(biāo)記剔除
函數(shù)雖然簡單,但是對處理HTML文檔還是很有效的 <% Function RemoveHTML(strHTML) Dim objRegExp, Match, Matches Set objRegExp = New Regexp
objRegExp.IgnoreCase = True objRegExp.Global = True '取閉合的<> objRegExp.Pattern = "<.+?>" '進(jìn)行匹配 Set Matches = objRegExp.Execute(strHTML)
' 遍歷匹配集合,并替換掉匹配的項目 For Each Match in Matches strHtml=Replace(strHTML,Match.Value,"") Next RemoveHTML=strHTML Set objRegExp = Nothing End Function
%>
|