当前位置:首页 > 公司荣誉 >

大多是“火一把死”的状态

发布时间:2018-10-18 08:54:01 作者:陕西誉丰源物资有限公司

原创+高质内容网站的福音 360搜索上线“后羿算法 houyi

原创内容之“殇”

此前,人们似乎都倾向于将“互联网”与“免费”等同起来。在我们看来,互联网的信息(内容、视频、图片作品等)就应该供网民们免费使用。在互联网的发展历史中,这一想法也愈发根植于我们的意识中。

然而近几年来,内容产出者、内容发行商等方对“知识版权”的意识越来越高,对版权保护也有了较为深刻的认知。但仍无法避免一些站点试图通过内容拼凑、偷换标题、隐瞒篡改出处、采集内容后小量修改等投机取巧的方式将他人的原创内容“据为己有”。

那么,搜索引擎和站长们该如何应对这种“窘境”呢?针对这一问题,近日360搜索上线的“后羿算法”也许可以给我们答案。

何为“后羿算法”?

所谓的“后羿算法”主要是控制低劣的内容采集站点,保护原创和稀缺性内容,并适当提高相关内容页的权重、排名等,同时确保新闻网站之间正常的转载行为不受影响。

“后羿算法”秉承了英雄后羿的“去除冗余,除暴安良”精神,控制互联网上的采集信息和垃圾信息;同时“后羿算法”积极倡导“原创精神”。360搜索方面表示:只有不断的倡导原创,控制采集,才能使整个互联网的信息丰富度和精品度持续提升。

另外,后羿算法采取了业界领先的大规模并行机器学习算法,通过亿万维度特征的刻画,结合对搜索领域问题的不断探索和实践,对海量文本数据进行主题和内容倾向性分析,对用户喜好程度进行全面建模和应用,能够对原创信息进行快速而精准的鉴别,并对采集行为和垃圾网页进行定向的约束和管控。

“后羿算法”打击恶意采集

目前来看,“后羿算法”主要针对互联网上泛滥的恶意采集进行抑制,其中包括一些滥用采集手段的行为,如整站大规模采集。此类恶意采集网站涉及领域有普通问答类,商品购物类,娱乐新闻类,企业商情类,成人色情类,赌博诈骗类,私服外挂类,违法违禁类等。

“后羿算法”还将控制一些生产低质的伪原创内容行为,如页面内容拼凑、大量无关热词堆砌等。此外影响用户浏览体验的行为,如含有大量广告干扰用户阅读、恶劣弹窗跳转、大量堆砌无关热词、站内搜索结果页等,也在“后羿算法”的控制之列。

此外,“后羿算法”还会从源头上控制恶意采集网站在360搜索上的展示,采集站主要靠流量变现来获益(如广告,弹窗,跳转,下载挂马等行为)。这其中的大部分行为会被搜索引擎视为“对用户不友好”或者“坑害用户”。

一旦被“后羿算法”认定为“低质内容”,则会导致网页的收录量的下降,以及搜索引擎排名的降低。另外,360搜索还表示,对于涉嫌敏感和色情的内容领域,也将遵循国家法律法规不断进行打击和控制。

原创+精品内容站点将从“后羿算法”中受益

360搜索方面表示,“后羿算法”上线后,将会增大内容丰富的优质网页(如原创内容、稀缺资源、精心编辑的内容页等)在搜索引擎结果页中的展示机会(有利于页面的收录及搜索引擎排名等)。

其实一直以来,360搜索都掌握着采集类站点的完整索引量和历史行为模式,并对之进行长期的密切的关注和监控,一旦发现有恶劣作弊倾向就会进行严肃处理,这不仅是对用户的负责,也是对认真做内容的站长们最大的安慰。

后羿算法上线,广大站长将何以应对?

无疑,用户们都喜欢高质量的原创内容。如今,互联网上每天大约会诞生数十万篇的“文章”,但目前中国互联网上由于种种不规范的转载和采集等行为造成的冗余信息规模已经上百亿。这不仅是对互联网资源的一种浪费,也是对原创内容的一种不尊重。

另外,从互联网的发展史看来,能“成大器”的几乎都是那些认认真真做内容、踏踏实实做事儿的网站。这些站点以高质原创内容作为支撑,无论搜索引擎算法如何改进,它们也不会畏惧。反观那些花花肠子多的站点,大多是“火一把死”的状态。

那么,身为站长的我们该如何避免“火一把死”呢?

推荐阅读/观看:天津网站建设 http://tjwzjs.net.cn


  • 上一篇:观察那些回复好几千条的帖子
  • 下一篇:最后一页