企业资讯

什么是Baiduspider - 百度蜘蛛

分类: 信息化百科 2011-01-30
【摘要】: 百度是如何收录到那么多网页的呢?这个百度用以抓取互联网上数以亿计的网页的程序,就叫做Baiduspider-百度蜘蛛。
    百度是如何收录到那么多网页的呢?这个百度用以抓取互联网上数以亿计的网页的程序,就叫做Baiduspider-百度蜘蛛。

    它是一个程序,夜以继日得在互联网上找寻新的URL,接着抓取URL上的内容,返回到百度的网页暂存数据库。

    百度用来抓取网页内容的程序,叫做Baiduspider,抓取其他内容的蜘蛛,则是新的名字:

    产品名称对应user-agent

    网页搜索Baiduspider

    无线搜索Baiduspider-mobile

    图片搜索Baiduspider-image

    视频搜索Baiduspider-video

    新闻搜索Baiduspider-news

    百度搜藏Baiduspider-favo

    百度联盟Baiduspider-cpro

    不少朋友会在自己的网站日志里看到这个蜘蛛Baiduspider-cpro,现在我们明白它是百度联盟蜘蛛,用以百度联盟程序匹配相应的广告。