广告联盟网

 找回密码
 注册
查看: 757|回复: 6
打印 上一主题 下一主题

搜索引擎怎样认定原创页面

[复制链接]
跳转到指定楼层
1#
发表于 2006-7-28 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
如果我把两篇文章合成一篇,是否会被认为是原创?
我觉得搜索引擎会根据两个方法判断,一是某段页面文字的"指纹",一是关键词密度排行。如果这样的话,单纯合成一篇,应该也有可能被认为是雷同页面,请高手解答一下
2#
发表于 2006-7-28 | 只看该作者
指纹的概念是什么?我不明白。
3#
发表于 2006-7-29 | 只看该作者
时间比对。
4#
 楼主| 发表于 2006-7-29 | 只看该作者
时间比对只是在判断雷同页面以后,我想知道如何判断雷同,我自己也在测试,不过需要很长的时间才能看出来。如果有高手能够解答就更好了
5#
发表于 2006-7-29 | 只看该作者
我觉得目前搜索引擎还是很难精准判断谁是原创,谁是采集

内容雷同其实比较好判断,可以根据title ,关键字密度,内容相似度等等判断

但如何判断原创与否?
如果按照时间判断,只要网站重新生成一下htm页面l,时间变成最新时间,那又如何判断呢?
6#
 楼主| 发表于 2006-7-29 | 只看该作者
搜索引擎会记录第一次收录页面的时间
7#
发表于 2006-7-31 | 只看该作者
相似度大于70%时,最先出现在网络上的是原创。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|广告联盟网  

GMT, 2024-9-29 , Processed in 0.063133 second(s), 19 queries .

Powered by Discuz! X3.2

© 2005-2021 www.ggads.com GGADS 广告联盟网

快速回复 返回顶部 返回列表