腾讯分分彩独胆二期
智軟工作室主要是為寧波公司提供寧波網站建設,寧波網站制作,寧波做網站公司,寧波外貿網站建設公司,寧波網站優化等項目,以優質的服務,優惠的價格,深的客戶信賴。相信有你的加入我們的明天會更有動力!期待與你合作!
  • 寧波智軟設計工作室,打造寧波網站制作工作室頂級品牌
  • 智軟擁有專業的設計團隊
  • 多年網站建設團隊為你服務
  • 智軟期待與你合作
  • 我們的技能
  • 我們掌握的技能有:dreamweaver,flash,photoshop
  • 寧波高端網站建設服務公司
    2014已經悄然到來,在新的一年我們恭賀所有客戶事業蒸蒸日上,同事慶祝智軟設計工作室成立5周年,在5周年為眾多客戶提供了保質量的網站設計與網站制作。 我們在新的一年質量與服務將會更加進一步為更多的客戶帶來高端的網站設計與服務!期待與你合作
  • 企業網站制作建設原因與服務介紹

    智軟設計工作室多年為寧波企業網站制作建設服務一直以來我們以最優惠價格,最優質的質量,最突出的設計!得到了客戶的一致認可,我們的服務包括:寧波網站設計,寧波網站建設,寧波網站制作,寧波網站優化,寧波英文網站制作我們會以優質的服務,最低的價格來報答客戶!

  • 點擊鏈接網站優化推廣介紹

    點擊連接網站優化推廣-對企業的網站優化和網站推廣--對企業的重要性-點擊進行詳細了解

  • 2014開幕,寧波網站設計服務全面優惠.

    2014開幕,寧波智軟設計為寧波企業提供更加優秀的設計和實惠的價格

  • 鏈接到網站案例展示平臺
    智軟設計工作為寧波客戶網站設計案例展示平臺-案例均為定期更新,讓新老客戶更好的看到我們做的案例,點擊查看我們做的網站案例吧!
  • 我們寧波網絡公司提供網站一站式解決方案
    智軟(寧波網絡公司)幫你輕松解決網絡問題,網站一站式解決方案
你當前的位置:智軟工作室 > 營銷與網絡 >

搜索引擎識別關鍵字堆切原理

2009-10-09 21:58

     關鍵字堆切:這個詞如果接觸錯SEO這個詞的話。一般都聽過。那么我們今天來研究下。搜索引擎是怎么來識別它的了 。

你是不是覺得奇怪。  搜索引擎有怎么牛B么。我告訴你它真的很牛。OK。來看看下面SEO大師寫的一段文件吧。

     搜索引擎和搜索引擎優化(SEO)一直是一對矛盾,合理的優化有助于搜索引擎對網站內容的識別,有助于網站推廣。然而有正面,就有反面,一些SEOers通過各種欺騙手段來欺騙搜蘇引擎,以期達到增加頁面收錄數和頁面排名的目的。

早期的關鍵字堆砌SPAM作弊方式之一,是將中文詞庫中的單詞直接用軟件拼湊成文章,這樣的文章沒有實際的意義,只能給搜索引擎看。那么對于這樣的文章,搜索引擎是通過什么方式來識別的呢?

我們知道,每個搜索引擎都有網頁質量監控部門,對于百度等摻雜人工處理的搜索引擎而言,用戶發現這樣的網站,投訴到百度,百度直接封了這個網站了事。但對于Google這樣的封站也是自動處理的搜索引擎而言,對關鍵字堆砌作弊的識別就顯得更為重要了。

對于關鍵字堆砌作弊方式的識別,搜索引擎一般采用統計分析的方法進行。

搜索引擎首先將網頁進行分詞,分詞完成后可以得到詞的數量N和文章長度L,從大量文章的統計中發現文章的長度L和詞的數量N兩個數字之間存在一定的分布關系,一般而言L/N界于4至8之間,均值大約在5-6之間。也就是說一篇長度為1000字節的文章中,應該有125-250個分詞,由于中文和英文的詞的組成不一致,因此在英文和中文中這個比值的范圍會風云私服有所不同。如果搜索引擎發現L/N特別大,那么這篇文章就存在就存在關鍵字堆砌現象了,如果L/N特別小,則可能是這篇文章是由一些詞所組成的沒有意義的文章,筆者對泥胚文章中的不同作者發表的文章進行了驗證,基本上都服從這個比值范圍。

進一步,通過大量正常文章統計發現,文章中密度最高的幾個關鍵字出現的次數之和與N/L存在一定的分布關系,搜索引擎就可以通過網頁中的分布與統計結果的分布圖進行比較得出文章是否存在關鍵字堆砌的現象。

此外,搜索引擎還將從停止字的比例來判定文章是否為自然文章。停止字就是如“的”“我”“是”等在文章中普遍使用的字或詞,如果文章中停止字的比例在正常的比例范圍之外,這個網頁應提交到網頁質量監控部門審核。

當然,還有更多的算法可以對網頁與自然語言的文章進行比較分析,以判別文章是否為自然文章。

所謂魔高一尺、道高一丈,有些作弊者已經放棄了單詞的組成文章的作弊方式,而改用句子組成文章的作弊方式,作弊者通過爬蟲或其它方式獲得網上文章的句子,并用軟件將數十篇文章的某幾句拼湊成一篇文章。這就需要搜索引擎做語義的分析來判斷是否作弊了,然而目前關于語義分析的研究還處于研究階段,這也是下一代智能搜索引擎的方向。

然而我們仍然不能將自動文章生成一棍子打死,基于人工智能的文章生成仍然是人類研究自身語言以及自身智能的一個重要方向。作弊與反作弊,將能促使人類對人工智能的研究。

如果到最后,軟件能生成人類能夠理解的文章,這是SPAM還是精華?你能肯定地說目前存在的智能化程度還不夠高的RSS聚合文章一定是SPAM嗎?然而,如果這樣的文章海量的出現,我們又該如何去面對這個現象?

 

OK。。這位大師寫的不錯。我們要多學習了.

更多

【責任編輯:小戴工程師】

關鍵字: 識別 關鍵字堆切 原理 搜索引擎

上一篇:網絡營銷最基本的幾個要素 下一篇:友情鏈接的5個重點

最新文章

2009-10-09 21:58

相關文章

2009-10-09 21:58
網站制作咨詢:
QQ:277728291
電話:18668277799
郵箱:[email protected]
期待你來電咨詢
回頂部
Copyright 2010 智軟工作室 版權所有    智軟為寧波公司提供最優惠的網絡服務【寧波網站建設,寧波網站制作公司,寧波做網站公司,寧波外貿網站建設公司】我們竭誠為你服務!
腾讯分分彩独胆二期