广告联盟网

 找回密码
 注册
查看: 2297|回复: 12
打印 上一主题 下一主题

GOOGLE防作弊系统1.0版本

[复制链接]
跳转到指定楼层
1#
发表于 2005-12-8 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
1. cookie, AdSense Program设置的cookie参数被加密,这些参数包含页面读取时间与点击发生时间间隔,显示器参数,浏览器插件特征等等,访问google.com.下的所有域都被检索cookie参数。
2. 规律性点击,模式匹配分析。//冤案经常发生在这里:-)
3. 动态加载javascript脚本监测自动点击软件行为。
4. IP段分析,每C类IP地址对一些账号集合的所最多允许的点击率,以防止互相点击行为。
5. Mac监测,毫无疑问,google的web服务器如同其所使用的操作系统一样也是自己打造(改造的apache)的,这种内嵌于操作系统的服务器可以统计访问者的MAC地址,当然这项分析很费时。
6. 第三方资料。google与很多公司有资料共享合作。
7. 未知方法。
8. 如果作弊不被发现那GOOGLE就不是google了。

该版本目前正在升级,将与被收购的Urchin的analytics系统整合。

[ Last edited by c123 on 2005-12-8 at 14:24 ]
13#
 楼主| 发表于 2005-12-9 | 只看该作者
在IP模块处理阶段Mac地址是透明的(不可见的),
在TCP模块IP地址是透明的
在HTTP阶段TCP数据也是透明的
所以,如果要取得Mac地址必定要在硬件启动层次Ethenet阶段进行。
12#
 楼主| 发表于 2005-12-9 | 只看该作者
每一个HTTP都封装有如下的格式信息:

1. Ethenet传输头部14字节: [ 目标Mac地址(6字节) 源Mac地址(6字节)  Ethenet类型(2字节)]

2. IP头20字节: [ IP头长度(1字节) 版本号(1字节) 服务类型(1字节) IP包总长度(2字节) 标识(2字节) IP包偏移值(2字节) TTL值(1字节) 协议(1字节) 校验和(2字节) 源IP地址(4字节) 目标IP地址(4字节) ]

3. TCP头20字节: [ 源端口(2字节)目标端口(2字节)TCP序列号(4字节)TCP应答序列号(4字节)TCP头长度(1字节)TCP标志(1字节)TCP窗口值(2字节)TCP校验和(2字节)TCP传输控制状态值(2字节) ]

4. HTTP协议数据
11#
发表于 2005-12-8 | 只看该作者
采集数据越多越有利,虽然我不确定Google到底采集那些信息。重要的不是匹配模型而是数据分析模型,对各种数据的权重等等。
没有什么是不可能的,我们说可能比说不可能犯错误的机会要少,特别是我们并不掌握信息的东西。
10#
发表于 2005-12-8 | 只看该作者
google根本没有必要提取那么多数据,最重要的是模型匹配。
MAC是不可能的。
9#
发表于 2005-12-8 | 只看该作者
嗯,我的理解是HTTP是建立在TCP/IP连接上的,但TCP/IP只是提供了一个双方通讯的路径和“门牌号”,以前看书,这个门牌号只是IP地址,好像没有MAC。而客户机和服务器之间通讯的内容完全是由HTTP协议规定的,但一般来说客户机发给服务器的HTTP请求中只包括以下信息Accept、Accept-Charset、Accept-Encoding、Accept-Language、Authorization、From、Host、If-Modified-Since、If-Match、If-None-Match、If-Range、If-Range、If-Unmodified-Since、Max-Forwards、Proxy-Authorization、Range、Referer、User-Agent。
8#
 楼主| 发表于 2005-12-8 | 只看该作者
HTTP封装了TCP数据流,TCP封装了IP包, 每个IP包的头部都包含源地址和目的地址信息。

Client -> Router - >....... -> Router -> Server -> Hardware Driver -> IP -> TCP -> HTTP

Mac信息在 Hardware Driver阶段提取。我的理解。
7#
发表于 2005-12-8 | 只看该作者
AdSense Programe的web服务器是一个二层应用结构, http是基于IP/TCP协议的,在送到IP/TCP处理之前在驱动层次会先提取mac信息。
________________________________________________________________
首先HTTP协议里没有MAC信息的传送。二来ADSENSE这个处理程序没在客户端浏览器上装什么插件,那理论上它在客户端的IE里运行时就没办法去提取MAC信息吧。毕竟他用脚本等的运行受到了巨大的限制。当然,这只是我的了解,如果GG能从微软那里拿到没有公开的接口的话,那倒也可以,但总感觉这有点不可思议。
6#
发表于 2005-12-8 | 只看该作者
了解一下不错,但不是普通用户研究的对象。
5#
 楼主| 发表于 2005-12-8 | 只看该作者
AdSense Programe的web服务器是一个二层应用结构, http是基于IP/TCP协议的,在送到IP/TCP处理之前在驱动层次会先提取mac信息。

[ Last edited by c123 on 2005-12-8 at 14:06 ]
您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|手机版|Archiver|广告联盟网  

GMT, 2024-9-21 , Processed in 0.091962 second(s), 20 queries .

Powered by Discuz! X3.2

© 2005-2021 www.ggads.com GGADS 广告联盟网

快速回复 返回顶部 返回列表