免费中文字幕日韩欧美,theporn国产在线精品,伊人成人在线视频,99国产精品久久一区二区三区

外貿課堂 外貿網站 外貿SEO 付費廣告 社交營銷 外貿營銷 外貿推廣 外貿知識 外貿政策 外貿百科
當前位置:首頁 > 外貿課堂 > 外貿營銷 > 搜索引擎蜘蛛爬行統計分析程序開發總結

搜索引擎蜘蛛爬行統計分析程序開發總結

一、搜索引擎蜘蛛爬行統計分析的必要性:

蜘蛛順利爬行網頁是網頁被搜索引擎收錄的前提條件,搜索引擎是否已爬行了網站,爬行了哪些頁面以及返回哪些信息給蜘蛛,掌握了這些情況我們才能對網站進行有針對性的優化改良,因此查看蜘蛛爬行日志是一件非常重要但卻非常痛苦的工作,尤其是SEOER及新站站長來說。比如從網上看到蜘蛛爬行某個頁面后如果返回200 0 64 ,則表示此網頁極有可能要被搜索引擎刪除,HEAD 請求返回404也表示要刪除網頁,如果我們能根據日志及時發現此現象就能根據實際情況及時做出調整。又如,蜘蛛爬行返回的301,302重定向及404錯誤等信息,也是網站管理員需要關心的問題。因此可以看出分析蜘蛛爬行日志的必要性。

二、蜘蛛爬行統計的方法:

由于蜘蛛機器人在網站爬行時是不會爬行JS(多次爬行只執行0次或者一次),flash,img等標簽的,因此,目前第三方統計軟件 (如阿江、中國站長站、雅虎、google等統計系統)還無法統計到蜘蛛爬行記錄。因此目前分析蜘蛛爬行主要通過以下方法: 1、利用PHP,ASP根據瀏覽器返回的USER_AGENT來動態進行跟蹤記錄,這樣的確可以實現目的,但其缺點很明顯:

a)加重服務器負擔,對于內容多及權重高的網站,蜘蛛抓取是非常頻繁的。在網頁中插入的代碼會額外加重服務器的負擔。

b)由于搜索引擎相對來說比較喜歡靜態頁面,很多網站都利用CMS把內容生成靜態文件,這樣就無法統計了。湖南某seo公司介紹使用img標簽或者script方式,即在靜態文件中將統計腳本利用img或者script標簽調用的方式,此方法經過我一個月的試驗,無法實現,蜘蛛不抓取頁面。

2、利用第三方日志分析工具:如linux下awstats及windows下的Webalizer,其缺點也很明顯。比如如果您是虛擬主機用戶的話,由于每天產生的日志非常多,每次分析時下載日志文件是一件非常痛苦的事。同時這些軟件太專業了,不適合一般站長使用。

3、如果您有更好的蜘蛛爬行分析方法請您和廣大站長一起分享。

三、專門針對搜索引擎蜘蛛爬行統計的日志分析工具開發總結:

1、 我們分析日志中需要關心蜘蛛爬行相關資料:

a)蜘蛛爬行日期:根據此來查找蜘蛛爬行的規律。

b)蜘蛛IP地址:不同來源的IP地址的蜘蛛的作用是不同,可以結合爬行日期及下面要講到的請求方式HEAD,GET來進行更詳細的規律總結。

c)請求方式:主要有HEAD和GET方式,其作用是不同的。HEAD方式一般是上次蜘蛛來訪問時發生一次或多次404錯誤,因此蜘蛛發送HEAD請求確認此網頁是否存在,一旦發送此請求如果返回依然是404的話,那么您的網頁就要被搜索引擎從數據庫中刪除了。GET方式大家都很明白就不說明了。

d)爬行頁面:蜘蛛爬行了哪些頁面。

e)狀態碼:服務器給蜘蛛返回的狀態碼,我們一般關心的是200,301,304,302,404,尤其是404及301,302。404表示死鏈,極大影響網站優化,301,302目前還是不能被搜索引擎友好識別,有作弊的嫌疑。

f)流量:在落伍上看到很多個人站長反應自己的服務器被蜘蛛拖跨,雖然這種說法有點夸張,但對服務器產生的壓力絕對不容忽視,尤其是某些太瘋狂的蜘蛛,每天產生很大的流量,因此我們需要統計出這些蜘蛛的相關信息,對我們不關系的搜索引擎蜘蛛可以在robots.txt中進行限制,以節約我們寶貴的服務器資源。

綜合以上考慮,使用WEB語言開發一套一個使用簡單,但功能專業的蜘蛛爬行統計程序放在自己的WEB空間上。這樣可以隨時隨地檢查蜘蛛爬行日志是非常必須的,并且可以避免下載日志的痛苦(當然,如果您使用的是獨立服務器的話且你能熟練使用那些專業的日志分析工具就不提了),如果能實現以上功能的同時我們在結合一些第三方的統計工具,那么我們小站長就完全可以撇開那些專業的日志分析軟件。

2、開發語言的選擇:由于這套分析程序是放在WEB服務器上的,因此考慮移植性是非常重要的,在WEB語言中,主要有JSP,php,asp,asp.net語言,JSP一般服務器是不支持的,ASP及.net在LINUX平臺下不支持,唯一可以選擇的是PHP語言。一般的windows及linux主機都會支持。其可移植性比較好。

3、程序擴展性:畢竟一個人的能力無法滿足大家不同的需求,因此程序在設計時將數據分析和表現進行隔離,我們將蜘蛛數據分析模塊獨立出一個只有7行代碼的文件,可以方便的根據服務器日志的格式重寫,因此您如果更換空間或者日志格式發生變化,您只需要根據我們提供的接口標準對分析模塊重寫即可,這并不需要多么高的程序開發水平。而不需要動其他任何文件,或者您將您的日志樣本提供給我們,我們為您重寫.程序還可以自定義統計蜘蛛類型,這樣可以提高分析速度,遠程分析日志等。

4、難點及局限性:在開發過程中遇到一個非常重要的問題,就是分析速度,WEB日志動轍幾十上百兆甚至G級,因此對于使用PHP語言來分析,既要考慮服務器承受能力,又要考慮分析速度,否則很容易導致超時現象,因此一套高效的算法是非常重要的,同時由于一般的日志記錄條數都很多,我們放棄使用數據庫,因為幾十萬條數據的插入及百萬級的數據查詢是相當痛苦的事情,對服務器的壓力太大,會把你的服務器瞬時CPU達到峰值,而且這些數據并不需要長期保存,畢竟要考慮大多數的虛擬主機站長.同時為了滿足部分站長的需求,程序將分析出來的蜘蛛日志按一定的格式寫入文本文件,您可以自己用任何一種語言編寫一段簡單的讀文件,插入數據庫的代碼將日志長期保存。通過不同的算法比較,目前找到的最好的算法分析速度如下:

本地分析: P4 1.7G+512M內存+WinXp環境(筆記本):

日志:100萬行,完全分析時間:10-15秒

VPS:384M內存+ Linux:

日志:100萬行,完全分析時間:22-28秒

遠程分析:即日志和分析系統不在同一臺機器上,遠程分析的速度主要取決于兩個網絡之間的速度。

遠程環境(日志存放位置):VPS:384M內存+ Linux,10M帶寬共享

本地環境(分析系統位置):P4 1.7G+512M內存+WinXp環境(筆記本),2M ADSL撥號網絡

日志:15萬行,完全分析時間:20-25秒

由此可見,遠程分析速度只有本地分析的1/10,因此還是建議將系統上傳到WEB服務器上,也可以節約您空間寶貴的流量。

以上是我在開發這套程序的總結,程序目前已完成核心的分析功能及顯示功能.

程序演示地址:.

更詳細的開發介紹:

希望站長網能有高人給我指點指點,主要還是在提高算法效率上。進一步完善后將放出下載地址。 此文首發admin5,轉載請務必保證其完整性!

上一篇:兩個半月的時間將關鍵詞“鐵觀音”做到百度首頁

下一篇:從一竅不通到外鏈新手:淺談醫療類網站外鏈


相關文章:

杭州市濱江區偉業路3號

業務熱線(微信同號):18143453325

業務郵箱:2848414880@qq.com

業務QQ:2848414880

目標:致力于幫助中國企業出海淘金

使命:為國內企業跨境出海提供動力支持

愿景:打造用戶期待和尊重的外貿服務商

Copy © 外貿巴巴 www.rwmhjww.cn 版權所有備案號:浙ICP備18013128號-2
激情国产在线| 亚洲高清久久| 祥仔av免费一区二区三区四区| 99免费精品| 国产精久久久| 91p九色成人| 伊人成人在线视频| 一区三区自拍| 国内自拍一区| 欧美中文字幕精在线不卡| 在线精品国产| 99热这里只有精品首页| 在线精品在线| 91九色综合| 热久久久久久久| 国内精品福利| 果冻天美麻豆一区二区国产| 亚洲男女网站| 久久国产麻豆精品| 伊人成综合网站| 国产精品老牛| 国产一区日韩欧美| 精品久久不卡| 日本免费一区二区三区视频| 亚洲全部视频| 欧美一区视频| av在线一区不卡| 色男人天堂综合再现| 日韩香蕉视频| 免费精品国产| 免费看久久久| 国产精品毛片久久久| 亚洲资源网你懂的| 99精品在线免费观看| 日本v片在线高清不卡在线观看| 水蜜桃在线视频| 欧美hd在线| 免费精品视频| 中文日韩在线| 日韩视频在线一区二区三区 | 综合综合综合综合综合网| 99精品视频免费| 国产精品伦一区二区| 精品日韩视频| 日韩三级在线| 欧洲美女精品免费观看视频| 色在线视频观看| 中文字幕不卡三区视频| segui88久久综合9999| 色综合久久网| 吉吉日韩欧美| 日韩免费视频| 99久久婷婷国产综合精品首页| 日本不卡免费高清视频在线| 日本不卡1234视频| 日韩久久综合| 欧洲av一区二区| 日韩欧美精品一区二区综合视频| 欧美成a人国产精品高清乱码在线观看片在线观看久 | 美女网站一区二区| 一区二区三区四区五区精品视频| 国产69精品久久久久按摩| 国产第一亚洲| 久久精品五月| 影音先锋日韩精品| 亚洲第一论坛sis| 亚洲一二av| 一区二区三区四区在线看 | 亚洲午夜久久| 91精品啪在线观看国产手机| 精品嫩草影院| 成人av国产| 麻豆91精品| 欧美国产大片| 日韩精品视频网站| 国产激情综合| www.成人网| 欧洲激情综合| 免费在线看成人av| 欧美一区=区三区| 日韩黄色免费电影| 日韩电影在线一区| 色愁久久久久久| 亚州av乱码久久精品蜜桃| 天堂成人国产精品一区| 日韩在线理论| 综合五月婷婷| 欧美色一级片| 影音国产精品| а√天堂中文在线资源8| 成人深夜福利| 亚州av日韩av| 欧美色图在线播放| 成人黄色av| 欧美在线黄色| 日韩av不卡在线观看| 久久人人99| 日本欧美视频| 麻豆国产91在线播放| 日韩成人精品在线观看| 欧美粗暴jizz性欧美20| 超碰激情在线| 日本成人在线一区| 成人av资源网址| 国产精品美女久久久浪潮软件| 亚洲男人av| www久久久| 久久神马影院| 欧洲一区二区三区精品| 成人黄色91| 国产精品av一区二区| 亚洲精品福利电影| www欧美在线观看| 久久精品国产www456c0m| 日本一二区不卡| 亚洲午夜精品一区二区国产 | 伊人国产精品| 久久在线视频免费观看| 日韩黄色大片| 同性恋视频一区| 中文亚洲欧美| 影音先锋日韩资源| 久久激情电影| 久久久人成影片一区二区三区在哪下载| 国产精品日本一区二区三区在线| 欧美jjzz| 97人人做人人爽香蕉精品| 日本一区二区三区播放| 久久99伊人| 国产成人视屏| 欧美在线资源| 日本麻豆一区二区三区视频| 91精品国产调教在线观看 | 欧美7777| 日韩在线视频一区二区三区| 爽好久久久欧美精品| 一区二区日韩欧美| 好吊日精品视频 | 日本特黄久久久高潮| 久久九九免费| 色狠狠一区二区三区| 国产女人18毛片水真多18精品| 日本一区二区三区视频| 国产欧美另类| 免费在线视频一区| 日韩欧美黄色| 蜜桃久久久久久久| 日韩成人av在线资源| 免费观看成人鲁鲁鲁鲁鲁视频| 国产精品免费大片| 视频在线观看一区二区三区| 国产欧美大片| 国产一二三在线| 综合伊人久久| av成人在线播放| 99国产精品一区二区| 久久精品国产久精国产| 精品中文一区| 欧美日韩亚洲一区| 乱码第一页成人| 亚洲亚洲免费| 男人av在线播放| 亚洲成人国产| 欧美人成网站| 久久不射中文字幕| 精品中文在线| 先锋影音网一区二区| 欧美高清日韩| 亚洲一区av| 欧美丰满日韩| 凹凸av导航大全精品| 四虎成人精品一区二区免费网站| 欧美1级日本1级| 国产成人精品999在线观看| 国产精品久久久久久久久妇女| 综合成人在线| 日韩高清中文字幕一区| 亚洲女同在线| 精品99久久| 国内揄拍国内精品久久| 色777狠狠狠综合伊人| 欧美成人专区| 欧美国产精品| 深夜成人在线| 2023国产精品久久久精品双| 亚洲丁香日韩| 久久久久久久性潮| 久久亚洲欧洲| 色哟哟精品丝袜一区二区| 麻豆国产91在线播放| 成年男女免费视频网站不卡| 久久亚洲影视| 日韩av中文字幕一区二区| 一区二区国产在线观看| 免费观看在线综合色| 99久久亚洲精品蜜臀| 亚洲人成网亚洲欧洲无码| 一区二区国产在线观看| 四季av一区二区凹凸精品| 99久久亚洲精品蜜臀|