关于站长如何做原创与伪原创,以前也有过自己的看法(站长们应该怎样避免重复内容出现),但是还是不完整,今天再来补充下。最近有个问题一直困挠着我,蜘蛛到底如何分辨原创与伪原创的呢?
这阵子很喜欢上A5,把自己博客里面原创的文章发到A5上,比如这篇文章谷歌VS百度优化差异、思考"贾君鹏你妈妈喊你回家吃饭"此帖的软文功效,改了下标题然后发表在A5上(个人对比百度和Google优化之间的差异),结果在百度上一搜,出现了大概有20来篇一模一样的文章,在百度上翻来翻去,最后一页终于找到收录博客上文章的链接了,然后有个念头,这样多次被人家转载到底搜索引擎怎么样才能判断这篇文章的原创地址呢?
A5的权重自然比博客高,蜘蛛在第一时间收录A5上的文章,放入数据库,因为蜘蛛对首次发现的内容会很敏感,敏感的意思就是会认为这就是原创,而个人对比百度和Google优化之间的差异这篇文章的最后我带有一个博客的链接,那么在博客上发的蜘蛛到底会不会认为是原创的那?分析了下,也请教了些SEO高手,大部分的意见就是A5上的蜘蛛会认为原创,而博客上的则是伪原创,即使有个博客的链接,唯一的好处就是给博客增加了个外链,因为两篇文章唯一的差别性就是最后一句话:本文首发地址:
http://www.bluece.com,转载请留首发地址!文章的修改程度很小,而且蜘蛛第一时间抓取的是A5上的文章。也会有另一种情况出现:若蜘蛛先访问了博客,当然权重会给博客,这很肯定。这样我们就可以终结了,原创的判断在于你文章的修改程度及蜘蛛抓取的时间。
第三种情况就是,如果你的文章没有发表在比你高的网站,但是由于你的网站权重不高,即使你的文章是原创,蜘蛛也未必会很快的找到你文章,等待一段时间后,当蜘蛛收录你的文章的时候,你的文章就会被认为是原创的了。
最后一种情况就是,当搜索引擎收录时会有一个收录的数据库,经过过滤后,收录的内容才会到搜索结果里来。在这个期间就有一些问题了,比如A站首次发表,B站转载。蜘蛛先访问A站再访问B站。而后可能先把B站的结果放出来了,而A站还在数据库里。所以说搜索引擎没有收录并不表示搜索引擎蜘蛛没有访问过这些内容,也许在搜索引擎的库存里已经有记录了,只是你查的时间没有放出来而已,就像20号才放出来的内容,但是快照是15号的,这就是搜索引擎的库存内容,同时这也是检验原创的核心时间点。
这是我对搜索引擎如何分辨原创与伪原创的一点看法,如有不全,欢迎补充,因为我写的时候,感觉我的思维有点混乱了~~~
转载请注明: >> 搜索引擎如何分辨原创与伪原创
版权所有:http://www.bluece.com 转载请注明出处本文链接:http://www.bluece.com/newsread.asp?u=102w321w3650t0