原创,外链,内链被称为SEO的三大法宝,缺一不可。因为人的思维方式和知识的广度都是有限的,针对同一知识点进行反复的写作,原创性必然越来越差。所以三大法宝中,原创又被认为是最难的一个方面,而且成为越来越多的企业SEOer们关注的热点。利用采集进行伪原创是很多站长采用的方法,显然被采集的文章质量,是否被百度收录,直接关系着你的伪原创文章的质量。本文笔者总结了如何在互联网上直接进行采集原创的文章。
百度中原创的概念就是没有被百度索引或收录的文字。百度不收录文章的原因无非有二。第一,文章实在太垃圾,不值得收录;第二,百度不去的地方。垃圾当然不是我们要采集的,所以如何寻找百度不去的地方是我们采集原创的出发点。
1、淘宝网的BBS
很多站长都知道百度对淘宝的BBS是不收录的,所以这是一个原创文章的重要来源。但是淘宝的门槛太低,谁都能去,谁都能进行采集,所以对于那些低权重的网站这招是越来越不灵了。
2、海外的华人论坛
这也是百度常常不去的地方,尤其是繁体字的论坛。但是由于互联网的限制,国内站长并不容易进入到这些论坛,很多时候要通过优秀的国外代理服务器进行翻墙。当然也正是因为门槛提高了,所以这些论坛的原创性较淘宝BBS更强大了。
3、学术期刊的中文数据库
一般中文学术期刊的数据库是百度进不去的。常用的著名的数据库有CNKI, 万方等数据库。如何进入这些数据库,方法很多,这里就不讨论了。当然并不是数据库的每篇文章都是百度没有收录的,通常你应该选择核心期刊的文章。如果你有下载硕士博士论文的权限,那么这些论文的原创性更是独一无二。从学术期刊数据库中下载下来的文章基本都是PDF格式,利用粘贴复制PDF的文字复制到word上,然后通过替换将PDF的段落取消,形成正常文章的排版。