百度站长学院前几天公布了一个案例,里面提到一些细节,特别值得站长重视。
它这个页面对爬虫爬取做的优化,直接将图片二进制内容放到了html中导致页面长度过长,大小164K,导致内容不被百度收录。

百度:网页长度大于128k会影响甚至不收录
网站如果针爬虫做优化,那么网页的长度最要在128K以内,不要过长。不然爬虫抓取内容后,页面内容过长被截断,已抓取部分无法识别到主体内容,最终导致页面被认定为空短而不收录。
言下之意,这可能是百度技术缺陷导致,如果网页在128K以上,爬虫无法抓取就无法收录。如果各位站长的网站内容过长,尽量删除一部分不太重要的信息,以保证内容收录。
百度工程师建议:
1、不建议站点使用js生成主体内容,如js渲染出错,很可能导致页面内容读取错误,页面无法抓取
2、 如站点针对爬虫爬取做优化,建议页面长度在128k之内,不要过长
3、针对爬虫爬取做优化,请将主题内容放于前方,避免抓取截断造成的内容抓取不全
内容出处:,
声明:本网站所收集的部分公开资料来源于互联网,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。文章链接:http://www.yixao.com/baidu/2256.html


相关推荐
-
百度4月份整顿3.8亿SEO作弊站点,值得注意的细节有哪些?
2021年4月份,百度整顿了3.8亿个作弊站点! 其中主要涉及如下方面: ①快速排名技术 ②恶意采集 ③网站劫持 ④欺骗下载 ⑤视频作弊,小说作弊等 这是百度搜索资源平台,今天发布…
-
常用博客SEO优化技巧
博客的SEO优化其实并不是特别重要,因为博客的关键在于内容,内容为王,有了优秀而独特的内容,就很容易取得较好的排名。当然,使用一些常用的SEO优化技巧也可以更好的改善排名。这里我以Z-Blog为例介绍一下常用的博客SEO优化技巧。
-
百度发力自建导航站:挑战长尾理论
百度使用hao222.com进行网址导航业务。 此前,百度收购了一个hao123.com,是个很知名的个人网站,就是做网址导航的。 这两个网站有什么区别呢? 就是域名不同,其他相同。 连网站上面的广告都是一模一样的。 百度从3月起开始全面停止与网址导航网站的推广合作,转而寻求与国内少数几家大型网站商谈收购或控股等方式运营。
-
怎样解决百度不收录网站首页
百度强调了标题和网站内容的相互呼应,如果标题中涉及到某一关键词,而实际网站内容中与该关键词无关的话,那么可能会被百度删除.所以建议在做编辑网站内容的同时注意标题出现的内容和文章内容的相关性,百度并非像有人说都是让人工审核他们的相关性,他们会根据关键词匹配和文章内容的相关性对其正确的收录。
-
忽略长尾关键词优化的损失
一般情况都是热门关键词用首页来做排名,而相对不热门的长尾关键词就用内页来排名,内页排名关键也就是内部的连接,一定要做到有效连接,在一个页面中多个关键词不要重复连接。
-
百度框计算从数据模块到应用平台
最近,互联网最火热的概念是什么? 答案是框计算,没有任何悬念。今天,百度世界大会的大幕会徐徐拉开,框计算将由热点变成沸点。框计算是在去年的百度世界大会上由李彦宏提出来的。在这一年的时间里,框计算的表现又如何呢?总结一下,一共可以划分为三个阶段
-
百度飞桨框架2.0正式版重磅发布,开发、训练、部署全面更新
在人工智能时代,深度学习框架下接芯片,上承各种应用,是“智能时代的操作系统”。近期,我国首个自主研发、功能完备、开源开放的产业级深度学习框架飞桨发布了2.0正式版,实现了一次跨时代…
-
百度入选中国20强全球最具竞争力公司
2009年10月24日,由国际知名的管理咨询公司罗兰贝格和《环球企业家》杂志联合举办的“2009年最具全球竞争力中国公司20强”评选结果出炉,全球最大的中文搜索引擎百度继2008年入围30强后,成为今年唯一进入20强的互联网企业,引发广泛赞誉及关注。
-
建个单页网站通过百青藤就能赚钱,只要流量为王
建个单页网站也赚钱,只要流量为王 百青藤就是一个广告联盟,我们可以在网站中悬挂百青藤平台提供的广告,进而获得百青藤给予的广告收益。 项目介绍 近期在网赚圈,这个项目非常火,不少培训…
-
百度首次发布《搜索引擎优化指南》
百度成立了“互联网创业者俱乐部”并发布了官方首份“百度搜索引擎优化指南”。我注意到,在提供“优化指南”的同时,百度还把一些产品心得融入了进去。在这份资料的描述上面来说,百度显示了很友好的一面,并没有把自己摆在很高的位置,做互联网产品的很值得一看。