最近有很多朋友找到谷歌大叔团队,咨询这么一个问题:刚刚放开的网站, 谷歌收录缓慢甚至是收录了一段时间就不收录了,网站到底出了什么问题。我们通过每一个环节的分析发现,绝大多数的问题,都出在了网站内容重复度方面。
今天谷歌大叔团队给大家带来了我们经常使用的免费内容重复度检测工具,其中既有网站内容的重复度检查工具,也有文本查重工具。希望可以帮助到遇到类似问题的朋友。
01
Siteliner
说到网站内容原创度检测,不得不说的就是Siteliner这款利器。它的厉害之处就在于可以检测到整个网站内部所有页面的文字重复度。但前提是,需要查重的页面没有被robot.txt文件屏蔽。
如图所示,直接在搜索框中输入域名,它就会扫描网站的重复内容、网页加载时间、每页的字数以及内链和外链等。免费账户的话,Siteliner 提供网站250个页面的查重。如果你的网站页面超过这一数量,可能就需要付费的高级账户。
在概览里面,我们可以看到整个网站的内容重复度状况。如果网站的内容重复度(Duplicate Content)高于20%,则为垃圾网站。另外还要注意一下Common Content的比例,一般控制在32%左右,如果比例过高,也会影响网站的收录。
如果想查看到底是哪些页面的内容是重复的,可以查看具体的URL。系统提供了页面的重复字数,重复度以及与之相匹配的页面,我习惯上对重复度进行一个从上到下的排序,这样就可以首先修改重复度比较高的页面。
点击具体的URL,我们就能按到具体文字内容重复的页面以及文字。如下图所示,当前左半部分URL页面中浅红色的部分,对应的就是右边标注浅红色的页面。左侧浅绿色的部分,就是和右侧浅绿色的页面有重合的文字。以此类推。
当然,如图所示的导航栏,侧边栏以及网站footer这些共有的部分,不可能不重复,所以我们只需要把内容部分去进行修改就可以了。
02
Copyscape
Copyscape主要是用于检测目前的网络上有没有跟你的网页重复的内容。
如图所示,输入域名,即可查看内容是否有重复。需要注意的一点是,Copyscape只能是单个网页去进行检索,没有办法一次性完成整站检测。
显示为New, 则表示没有重复网页。如果有重复内容,它会列出详细的网址。如果是别人窃取了你的内容,你可以Email通知他们去移除内容。网站的重复内容大于10%,则视为垃圾网站。
03
Smallseotools
相信很多人都使用过这个网站,他的功能非常强大,其中包含关键词工具,外链工具,内容工具等等。重点是都免费!有兴趣的可以用用看。今天我们要说的就是它的剽窃检查工具(Plagiarism Checker)
Plagiarism Checker支持两种检测方式,一种是直接粘贴文本或上传文档检测,字数不能超过1000字。另外一种是直接输入网址。如果是你找写手帮你写了英文的内容,想检查其是否为原创,便可以使用文本检测功能。如果是网站上的内容,直接使用URL检测就可以了。
但有一点不太好的是,网站上面有很多的广告,严重影响用户体验。
04
Duplichecker
Duplichecker主要是用于文本重复度检测,免费账户也是有1000字符的限制。你可以直接粘贴文本进行检测,也可以上传文件进行检测。无需注册,方便快捷,但缺点也是广告比较多,影响体验。
05
Check-plagiarism
Check-plagiarism同样支持文本检测和网页检测。这个网站的界面就比较干净整洁,使用起来很方便。直接输入想要检测的内容,点击Check Plagiarism, 系统便会显示原创内容(Unique Content)的比例和 重复内容(Plagiarized Content)的比例。
除此之外,我们可以看到每一个句子的内容重复度检测显示,如果有重复的内容还会显示与之相重复的网页。
06
Copyleaks
Copyleaks主要提供教育和商务领域的内容原创度检测功能,它是付费的,但提供30天的免费试用期。系统支持文件、网页以及文本重复度检测。
输入文本或者网址,进行检测,之后便会检测出网络上与之相重复的部分,并显示网址以及重复程度。
打开详细报告,便可查看具体的重复部分。
谷歌大叔团队经常会使用Siteliner 检测整站内容的原创度,Copyscape 检测网站同网络上其他内容的重复度,其他的4款工具作为文本内容原创度检测工具。通过仔细的检测,确保网站内容的原创度。
当然有的时候在检查文章内容的原创度的时候,我们还是会使用最古老,最简答的方法-谷歌搜索。随便在文章中挑出几句话,放在搜索引擎里面,检查是否与现在网络上的内容有重复。
今天的分享就到这里,如果大家有什么问题,欢迎随时留言或者是联系我们:
QQ群:225837625
谷歌大叔微信号:18553154346