鏡像站點 | MAP
 
網站首頁 網站策劃 優化推廣 作品展示 費用標準   SEO知識 技術文獻 聯系方式 FAQ

 
SEO知識
技術文獻
相關文章

首頁 > 技術文獻

asp過濾清除word垃圾代碼的函數

TIME:2009-6-16 21:03:08  HITS:

關鍵字:哈爾濱網站建設,哈爾濱網站設計  摘自:目標科技

  不知道哈爾濱網站建設者們有沒有過這樣的經驗,把網站后臺交給用戶使用之后,用戶會說網站后臺添加內容的時候出錯,經查許多用戶直接把自己的word文檔復制到在線網頁編輯器,然后進行提交導致的錯誤,這是什么原因呢,大家在做網站的時候可以試試,從word中粘貼過來一段文檔,然后查看網頁源碼,會發現復制過來的文字很少,但垃圾代碼極多,請看下圖:

  由于這樣的垃圾代碼極多,所以我們在提交內容的時候超出了字段最大長度,這也就是為什么我們在網站制作過程中經常會出錯粘貼word文檔提交出錯的情況了,請看下圖:

  錄入這樣的文章內容,即不利于網站的seo優化推廣,對網站建設者來說有時會把網頁擠變形,所以我們需要過濾這樣的word垃圾代碼,下面給出兩個函數,請大家參考使用。

  以下的asp函數可能需要IIS6來支持,否則運行會出錯。

<% '清除word格式
function  ParseCode(strContent) 
  dim  re 
  Set  re=new  RegExp 
  re.IgnoreCase  =true 
  re.Global=True 
   
  '濾掉style  <SPAN>  </span>  <o:p>  </o:p>  <?xml> 
  re.Pattern="style=(['\x22])[^'\x22 <>]*\1| <span[^ <>]*>| <\/span>| <o:p>| <\/o:p>| <\?xml[^ <>]*>" 
  strContent=re.Replace(strContent,"")     
  re.Pattern=" <TABLE[^ <>]*>" 
  strContent=re.Replace(strContent," <table  border=1  cellspacing=0  cellpadding=3  bordercolorlight=000000  bordercolordark=ffffff>") 
   
  set  re=Nothing 
  ParseCode=strContent
  ParseCode=Replace(ParseCode,"class=MsoNormal","") '希望這里也用正在替換,不然文章一多速度有點慢啊
  ParseCode=Replace(ParseCode," <FONT size=2>","")'希望這里也用正在替換,不然文章一多速度有點慢啊
 
  end  Function
  %>

 

 


<%
dim regEx
set regEx=New RegExp
    regEx.IgnoreCase=True
    regEx.Global=True
function cleanAndPaste(html)
regEx.Pattern="<\/?SPAN[^>]*>"
html = regEx.replace(html,"" ) 'Remove all SPAN tags
regEx.Pattern="<(\w[^>]*) class=([^ |>]*)([^>]*)"
html = regEx.replace(html, "<$1$3") 'Remove Class attributes
regEx.Pattern="<(\w[^>]*) style=""([^""]*)""([^>]*)"
html = regEx.replace(html, "<$1$3") 'Remove Style attributes
regEx.Pattern="<(\w[^>]*) lang=([^ |>]*)([^>]*)"
html = regEx.replace(html, "<$1$3") 'Remove Lang attributes
regEx.Pattern="<\\?\?xml[^>]*>"
html = regEx.replace(html, "") 'Remove XML elements and declarations
regEx.Pattern="<\/?\w+:[^>]*>"
html = regEx.replace(html, "") ' Remove Tags with XML namespace declarations: <o:p></o:p>
regEx.Pattern=" "
html = regEx.replace(html," ")' Replace the    
    regEx.Pattern="(<P)([^>]*>.*?)(<\/P>)"
    html = regEx.replace(html,"<div$2</div>")
    cleanAndPaste= html
end function
'測試一小段的
response.write cleanAndPaste("<p>aaaaaaaaaaaaa</p>")
%>

  以上僅是個人收集的程序,來源于網絡,如有不對之處,請哈爾濱網站建設工作者,哈爾濱網站制作人員及時指正錯誤,歡迎留言。


哈爾濱目標科技開發有限公司 • 版權所有 CopyRight 2009-2012

QQ:36268333

哈爾濱網站建設熱線:13945093721 0451-88002799

mgcc电子游艺城