百度搜索算法主要从四个维度衡量站点是否存在违规问题:内容质量、需求满足、用户体验和搜索公正。本文阐述搜索优化过程中不允许发生的违规问题、需规避的运营“雷点”,助力开发者更好地提升自身资源质量。



百度搜索算法规范

劲风算法:针对恶劣聚合页问题, 跨领域内容、题文不符问题、静态搜索结果页

细雨算法2.0:针对B2B领域低质问题,恶劣采集问题、发布软文问题、空短低质页面、受益问题

标题规范:针对页面标题违规问题、 虚假标题问题、关键词堆砌问题

清风算法3.0:针对下载站违规问题,挂马或窃取隐私、欺骗下载问题、捆绑下载问题

信风算法:针对虚假翻页诱导问题,虚假翻页问题、自动跳转问题

违规信息规范:针对违法违规信息,虚假诈骗信息、违法交易信息、黄赌毒信息

冰桶算法5.0:针对移动落地页体验问题、页面浏览顺畅、广告布局合理、交互操作舒适、服务流程闭环

内容权限规范:针对用户权限问题,内容获取权限、功能使用权限

惊雷算法2.0:针对恶意刷点击问题,恶意刷点击、超链作弊

烽火算法2.0:针对恶意劫持行为、 跳转劫持问题、回退劫持问题

被黑相关:针对被黑问题、网站被黑

涉及页面内容算法

涉及页面内容质量算法有飓风算法3.0、劲风算法、细雨算法2.0、蓝天算法。

飓风算法

飓风算法针对页面内容质量问题:站群问题、跨领域内容、恶劣采集问题。

百度搜索于2017年7月4日发布飓风算法,严厉打击恶劣采集问题,在2018年9月13日公布飓风算法升级为2.0版本,在2019年8月对飓风算法进行升级,上线飓风算法3.0。

恶劣采集行为

存在大量从其他站点、智能小程序公众号等内容生产方采集、搬运而来的内容,信息未经整合,排版混乱,文章可读性差,有明显采集痕迹,对用户无任何增益价值。

存在多段文章拼接的内容,文章逻辑性差,无法满足用户需求,阅读体验差。

站点或智能小程序内存在大量采集内容,自身内容生产力极差。

跨领域采集问题

指站点/智能小程序为了获取更多流量,发布不属于站点/智能小程序领域范围的内容,通常这些内容采集自互联网,内容质量及相关性低、对搜索用户价值低。对于这样的行为搜索会判定该站点/智能小程序的领域专注度不足,会有不同程度的限制展现。

跨领域采集主要包括下面两类问题:

第一类:主站或主页的内容/标题/关键词/摘要等信息显示该站有明确的领域或行业,但发布内容与该领域不相关,或相关性较低。

第二类:站点/智能小程序没有明确的领域或行业,内容涉及多个领域或行业,领域模糊、领域专注度低。

站群问题

指批量构造多个站点/智能小程序,获取搜索流量的行为。站群中的站点/智能小程序大多质量低、资源稀缺性低、内容相似度高、甚至复用相同模板,难以满足搜索用户的需求。


劲风算法

劲风算法针对恶劣聚合页问题:跨领域内容、题文不符问题、静态搜索结果页。聚合页,是指页面并无文章主体内容,而是多个页面的索引链接围绕在特定主题下的信息整合页。

2020年2月,百度搜索技术团队发现,部分网站及智能小程序通过恶意构造聚合页面内容来获取搜索排名,获得搜索用户关注,上线劲风算法,控制恶意构造聚合页的问题对搜索用户的影响。

恶劣聚合页问题主要有:

1.页面内容与站点本身所属领域不符,或站点无专注领域,多为采集拼凑内容。

2.页面内容与标题及页面中标记的标签不符。

3.由网站搜索功能生成的静态搜索结果页。

4.空短、无有效信息、失效的聚合页。

细雨算法

细雨算法针对B2B领域低质问题:恶劣采集问题、发布软文问题、空短低质页面、受益问题


2018年6月,百度搜索发布细雨算法,针对B2B行业的网站受益问题进行规范和引导。

2019年11月,百度搜索发布细雨算法2.0,针对B2B行业的恶劣违规问题及低质内容。


页面标题作弊及误导

1.非公司官网,title中包含"官网";等字样,误导搜索用户认为是官网

2.页面title中堆砌相近关键词;

3.页面title中穿插火星文字或者特殊符号,影响正常阅读

正文内容中存在受益信息

1.正文内容不完整,频繁穿插变形的受益方式。

具体是指:正文内容为无价值内容的拼接或者正文内容不完整,同时采用"英文字母";、"汉字谐音";、"特殊符合";、"全角符合";等方式代替联系方式,穿插在正文内容中。

2.文章的配图图片中存在受益联系方式。

具体是指:图片中联系方式水印面积较大,严重损害浏览体验。

3.正文中商品或者服务信息内容为乱采集、拼接而成、排版混乱、用户从页面中无法获得商品或者服务信息。


恶劣违规内容

1.页面内容恶劣采集。如:拼接内容、纯采集内容、跨领域采集内容等。

2.发布软文信息。

问题示例:利用小程序页面发布软文,页面标题是"垃圾车厂家哪家好",内容是品牌软文,对用户产生误导

3.发布无法满足用户需求的空白页面,对用户完全无价值。

问题示例:该小程序页面为空白页面

4.商品信息有误。

如:商品详情、价格等与实际情况不符

5.功能不可用。

如:交易、联系电话、查看详情等交互功能不可用等情况。


低质内容

1.图片内容低质。

如:图片内容与文字描述不一致、图片嵌入电话号码、图片质量极低影响阅读体验等。

2.页面内容低质

如:页面中只有图片无有效信息,或信息提供不完善等情况。

问题示例:网站仅有图片作为展示,没有文字说明

蓝天算法

蓝天算法针对目录交易问题,2016年11月,百度搜索推出蓝天算法,持续打击新闻类站点售卖软文、目录的行为,还用户一片搜索蓝天。被“蓝天算法”所覆盖的站点将会被降低其在百度搜索系统中的评价。

用户需求满足

百度搜索页面标题规范

2018年11月,百度搜索针对页面标题作弊行为发布《百度搜索页面标题规范》,对搜索生态下的网页标题进行了严格的规范和要求。不符合《百度搜索页面标题规范》的站点,将会被清风算法1.0覆盖,受到限制搜索展现的处理。

标题的原则

• 站点或智能小程序应确保每个页面都有指定的标题,且同一站点的不同页面应分别使用不同的标题;

• 页面标题应准确概括页面内容,避免使用模糊和不相关的描述;

• 页面标题应简明扼要,避免使用冗长的标题,避免关键词堆砌;

• 页面标题的符号使用正确,建议参考百度建议的标题符号用法(详细内容请参见后文“3.2标题的符号”部分)

不允许出现的标题类型

标题存在以下恶劣问题时,会对这类结果做相应的搜索结果展现限制。

标题内容虚假

指标题和页面内容不相符,欺骗诱导用户点击的情况。

类型1:虚假官网

指非官方站点或智能小程序,但标题表述为官网的情况。

类型2:无法满足用户需求

如:标题中标明可下载或在线阅读小说txt,但是页面中不提供下载服务或诱导用户下载APP;或在标题中说明有百度云下载、支持在线观看,但是页面既不能下载,又不能在线观看。

类型3:标题表述部分虚假

如:某网页标题中标明有江苏一本大学排名,但页面只有大学名单,而没有排名相关的内容。

标题重复、堆砌

指站点或智能小程序通过页面标题过度重复或堆砌等手段,获取不正当流量的情况。

类型1:标题关键词大量重复

类型2:标题大量堆砌语义相近的关键词标签


清风算法

清风算法3.0针对下载站违规问题2018年10月,百度搜索发布《百度搜索下载站质量规范》,对百度搜索范围内下载站点及智能小程序的行为进行严格要求和控制。不符合此规范的下载站或智能小程序,将会被清风算法3.0覆盖,受到搜索展现的限制。

《百度下载站质量规范》


下载站质量规范概要

下载站需遵守以下原则,坚持为用户提供高质量、有效,安全的下载服务:

①保证软件的安全性,无挂马、窃取用户隐私等恶意行为;

②无”李鬼下载“行为,通过普通下载/本地下载入口下载的软件必须为下载按钮文字描述的目标软件;

③下载页面中不能存在与下载按钮类似的诱导类广告;

④允许存在安全下载/高速下载的情况,但是页面中必须有明确说明解释。


下载站质量规范说明

 PC端下载站质量规范

PC端下载站质量规范图示:PC端下载站页面

a板块.本地下载:

应保证下载软件的安全性,无挂马、窃取用户隐私等问题;

本地下载/普通下载点击后,效果必须为直接下载目标软件,不能存在下载内容与描述不符的“李鬼下载”问题;

b板块.高速下载:

若存在高速下载情况,需要在页面上明确告知用户其与本地下载(如上图a区所示)的区别,如:说明实际效果为先下载高速下载器,然后在高速下载器中下载目标软件(如上图b区所示);

c板块.诱导广告:


下载页面中不能存在与下载按钮相似的诱导类广告,如上图c区所示的情况是不允许出现的。


高速下载器规范


说明:此项规范针对用户在PC页面中下载高速下载器后,通过高速下载器下载目标软件的情况。

高速下载器规范

图示:用户下载高速下载器打开后的界面

①允许下载前默认勾选推荐软件(如上图红框区域所示),但是用户可自主根据实际需求取消勾选,取消勾选后不能再将推荐软件进行捆绑下载;

②推荐下载的软件不能为色情、赌博等违法软件;



移动端下载站质量规范

移动端下载站质量规范

图示:移动端下载界面



①保证下载软件的安全性,无挂马、窃取用户隐私等问题;

②下载点击后,效果必须为直接下载目标软件,不能存在“李鬼下载”现象;

③下载需要有明确说明,在页面上告知用户,如上图所示,说明实际效果为先下载某应用市场,后续可在应用市场中下载目标软件,这种方式更加安全等;

④允许默认勾选,优先进行高速下载,但用户可自主根据实际情况取消勾选,直接进入普通下载,下载目标软件。

信风算法

信风算法针对虚假翻页诱导问题2019年5月,百度搜索发布信风算法,控制网站或智能小程序利用翻页键诱导用户的行为。用户点击翻页键时,自动跳转至网站的其他频道页(如目录页、站外广告页等)。

违规信息规范

2019年2月,百度搜索发布《关于百度搜索严厉打击虚假诈骗等违法违规信息的公告》,打击电信网络中的虚假诈骗、违法交易、黄赌毒等违法违规信息。

百度搜索打击的违法违规信息包括但不限于以下内容:

虚假、诈骗类信息

1.仿冒政府/企业官网、伪造政府/企业联系方式等,或恶意传播相关虚假信息;

2.售卖或传播诈骗相关的书籍、手法、工具,宣传不正当获利手段;

违法交易类信息

1.伪造证件:如伪造驾照、身份证、结婚证、银行卡等;

2.恶意套现交易:如花呗套现、白条套现等;

3.学术不端:如代发论文、代写论文等;

4.私家侦探:不符合国家法律规定,恶意探究他人隐私,侵犯他人隐私权等;

5.违法贷款:未取得政府认可,进行无抵押贷款、黑户贷款、裸贷等;

6.违规软件:恶意提供软件破解版、游戏外挂、刷赞/刷粉等作弊工具软件;

7.违规兼职网赚:发布刷单、打字等欺诈类兼职或违法灰色网赚信息,导致网络用户财产受损;

黄赌毒信息

1.恶意传播色情淫秽内容或擦边信息;

2.恶意传播非国家认可的彩种信息,引导大众赌博,如时时彩等;

3.恶意传播赌博微信群、赌博工具、聚众赌博地点等非法内容。

用户体验友好

冰桶算法

2014年8月22日,百度搜索针对低质页面问题发布冰桶算法,经过不断更新迭代,在2018年11月对冰桶算法进行升级,上线冰桶算法5.0。

页面浏览顺畅、广告布局合理、交互操作舒适、服务流程闭环。

内容权限规范

针对用户权限问题,内容获取权限,功能使用权限

1、内容获取权限:

用户查看网页中的全部内容时,网站强制用户必须完成指定操作后才可进行查看,包括但不限于以下方式:

 强制用户完成网站注册或登录

强制用户下载相关APP

强制用户在APP内查看内容

强制用户完成其他要求

2、功能使用权限:

用户使用网页中的功能时,网站强制用户必须完成指定操作后才可进行查看,包括但不限于以下方式:

强制用户完成网站注册或登录

强制用户下载相关APP

强制用户在APP内查看内容

强制用户完成其他要求


搜索公正及用户安全

惊雷算法

惊雷算法2.0主要针对“恶意制造作弊超链”和“恶意刷点击”的作弊行为。针对作弊的网站,将会受到限制搜索展现、清洗作弊链接、清洗点击的处理,并会将站点作弊行为计入站点历史,严重者将永久封禁。

烽火算法

烽火算法打击的网站劫持有以下两种表现形式

跳转劫持:用户点击目标网页后,页面直接跳转至另一页面;

后退劫持:用户完成对某网页的浏览,点击“后退”按钮时出现以下几种情况

1.无法后退,点击后退时页面无反应,内容无变化;

2.后退到“假百度页面”,搜索结果出现霸屏现象;

3.后退到用户之前没有访问过的垃圾、作弊等低质网页。


被黑相关

被黑相关——针对被黑问题,2018年3月,为了保证搜索生态安全,保障用户权益,百度搜索发布《网站被黑操作指南》,引导站点排查被黑情况。

网站被黑,通常表现为网站中出现大量非本网站发布的类似博彩内容,或网站页面直接跳转到博彩页面。



trips:以上信息来源百度搜索算法规范