SE如何判断文章重复性与伪原创编辑的技巧
SE如何判断文章重复性
SE可以说一个是由全球顶尖的IT工程师们开发出的超大型算法程序,远没有想象的那么简单。
判断文章相似度并不是简单的看一个页面
SE判断相似度是一个综合指标,并不是简单的看你某页面是否与数据库里的某个页面相似,而是基于整站构架的考虑,如果你全是采集,目录构架和采集站一样的话,仍然能识别出你是重复内容,所以即使你每个页面都加一些例如转载信息类的文字来试图和原页面不同,如果正文还是采集回来的话,SE仍然能识别出你是重复内容。
并不是说换了套不一样的模板就显得不相似了
SE处理页面文字是将所有的HTML代码去掉看的,所以并不是说换个模板它就认为你和原页面不形似。
另外如果是已经做了一段时间的站建议不要换模板,因为换模板可能会把每个页面的内部链接变掉,有可能会影响搜索引擎收录,如果实在要换,建议保持原有页面的内部链接规则。
SE会把每个元素分解开来处理
SE判别相似度的因素很多,他会把页面的所有因素都劈开,如页面TITLE,整体布局,文字信息,内部链接架构,URL规律,再综合评判你是否相似。
所以除非你能把采集回来的东西把这些因素都和原站几乎所有的因素都不形似,但是如果你真能做到的话,那也就不叫采集了。
伪原创编辑的技巧
伪原创,就是把网络上别处的文章参照自己站点的方式结合自己的语言和思想所做的变相修改。伪原创则意味着对原创进行的第二次或者第N次经过修改的转载发表。比如修改标题,增加摘要,转载不完整内容,去掉文章图片,甚至直接贴牌出售等。
1、文章标题
更新文章信息的标题改动,例如:“网络营销”和“企赢网络营销策划”,标题的修改,非常重要,直接引导搜索引擎的第一视线,需要注意标题的技巧引导性。
2、关键词处理
醒目文字处理+超链接,目的实现站内链接资源,增加用户体验度。
3、内容需要不同
GOOGLE对有75%以上内容相同的文章基本上不收录,也就是说,如果我们采集编辑过的文章内容无变动调整,除了扩充网站资源外,带来不了流量,同时我们也可以在后台关注我们发的文章是否有人点击查看过,也是检索我们发布文章质量的一个标准,重文章质量,不要太注重文章数量。
1. 要注明文章的开头和结尾,这两个地方是搜索引擎认为比较重要的地方,所以你处理伪原创的时候可以在这两个地方加上你要优化的关键字和链接,但是要注意,行文要流畅,而且不要整个网站就优化那一两个关键字,这样做不好,首先搜索引擎会不喜欢,可能认为你有优化过度的嫌疑,其次,你的网站其实很多流量可以由长尾关键字带来的,所以可以在这两个地方多做一些关键字。
2. 要注意伪原创的更新速度,伪原创的文章要以一个比较固定的速度创作,可以一天一篇,或者两天一篇,保持一个固定速度,不要说我今天有时间了,给网站传上20篇伪原创文章,今天没有时间就不上传了,这样会给搜索引擎带来一个不好的印象,怎么这个网站变化这么大,是不是作弊了?
3. 关于伪原创来源的问题,不要找网上传的很热的那种文章,第一那些文章大家都做得太多了,想做到搜索引擎前面太困难了,第二,伪原创处理也不太好处理,所以要找就找那些收录量少或者没有收录的,没有收录的比如说一些blog,blog一般收录比较慢,我们可以打一个时间差,在blog搜索那些刚发表不久的文章,这些文章稍微处理一下就是一篇好的伪原创文章,另外,还有就是一些不对搜索引擎开放的论坛,这些论坛里面的文章都是绝好的伪原创文章。
4、最重要的是对心态的把握
坚持就是胜利