灵感的来临,没有任何预兆;灵感的消失,也不会有告别仪式;用文字记下她们吧,让灵感永存……

502 Server Error of Google.CN

看图不说话。

davies 发表于 2008 年 03 月 3 日 | 0 条留言

Adsense 在中国开始支持西联快汇支付

今天登录Adsense查看近期的收入情况,突然发现修改付款方式的页面已经多了一项:

选择付款形式

当月 15 日之后对这些设置的改动则可能在当前付款周期生效,也可能在下一个付款周期生效。

西联快汇 了解更多信息
* * 西联快汇付款可在汇出一天后取款。
检查选项
*
了解更多信息 **
* 标准投递支票通过普通邮件递送,在邮寄后 2-3 周内应可到达。
** 安全快递支票通过运营商投递,1 周内应可到达。

以前中国的Adsense用户只能通过支票的方式获得付款,周期长,费用高,手续麻烦,一直都是设置付款保留,等有了电子转账或者其它更快捷的支付方式了再兑现。期待了好久的功能,终于等到了,赶紧取消保留付款。

根据Adsense的付款周期,到下个月中旬(15日)修改才会生效,得到下个月底(10月底)才会支付9月份的收入,预计11月初可以拿到款项。

在校内的邮局就有西联汇款业务,相当方便呀。

使用了Adsense的国内用户,并且收入已经过100美元的,赶紧去看看吧。

davies 发表于 2007 年 09 月 30 日 | 4 条留言

来自 Google 的技术文章

Google 实验室列出了员工所发表的文章。为了方便自己和其他有兴趣的人阅读,将它们都收集起来做了一个镜像,在 http://www.daviesliu.net/GooglePapers/ 。欢迎一起交流学习心得:-)

也可以一起打包下载:http://www.daviesliu.net/GooglePapers/GooglePapers.zip

绝大部分文章都找到了其 pdf 版本,少数几篇缺失,保留了原来的链接。

davies 发表于 2007 年 01 月 14 日 | 0 条留言

换路由访问 Gmail

光缆断了,使用 Gmail 实在痛苦,半天没动静,好在今天在 Google 版看到 kxn 提供的方案:光缆故障期间访问Gmail等Google产品的方法,具体方法就是将mail.google.com解析为66.249.89.83,原来是解析为 209.85.139.18,通过在文件windows/system32/drivers/etc/hosts中加入一行 66.249.89.83 mail.google.com 来实现。

试用了一下,效果明显。为什么会这样呢?看一下访问这两个IP的路由就清楚了。新的路由过程为:
Tracing route to mail.google.com [66.249.89.83]
over a maximum of 30 hops:
  1    <1 ms    <1 ms    <1 ms  th124001.ip.tsinghua.edu.cn [59.66.124.1]
  2    <1 ms    <1 ms    <1 ms  th003137.ip.tsinghua.edu.cn [59.66.3.137]
  3     9 ms    10 ms    10 ms  th002025.ip.tsinghua.edu.cn [59.66.2.25]
  4    18 ms    19 ms    16 ms  qhu0.cernet.net [202.112.38.69]
  5    19 ms    19 ms    19 ms  202.112.53.178
  6     *      445 ms   434 ms  219.158.28.25
  7   428 ms   436 ms   427 ms  219.158.11.57
  8   418 ms   407 ms   400 ms  219.158.3.30
  9     *        *        *     Request timed out.
 10     *        *      439 ms  72.14.239.142
 11   415 ms   429 ms   398 ms  216.239.47.74
 12   390 ms   390 ms   395 ms  216.239.47.54
 13     *      412 ms   413 ms  mail.google.com [66.249.89.83]

原来的路由过程:
Tracing route to pr-in-f18.google.com [209.85.139.18]
over a maximum of 30 hops:
  1    <1 ms    <1 ms    <1 ms  th124001.ip.tsinghua.edu.cn [59.66.124.1]
  2    <1 ms    <1 ms    <1 ms  th003137.ip.tsinghua.edu.cn [59.66.3.137]
  3    10 ms    10 ms    11 ms  th002025.ip.tsinghua.edu.cn [59.66.2.25]
  4    26 ms    24 ms    25 ms  qhu0.cernet.net [202.112.38.69]
  5    34 ms    34 ms    32 ms  202.112.36.250
  6    36 ms    37 ms    36 ms  202.112.36.254
  7    30 ms    29 ms    30 ms  202.112.53.202
  8     *        *      129 ms  219.158.32.97
  9     *      135 ms   128 ms  219.158.21.253
 10   171 ms   178 ms   175 ms  219.158.4.105
 11   170 ms   170 ms   168 ms  219.158.3.118
 12     *        *      617 ms  219.158.25.118
 13     *        *      628 ms  219.158.25.61
 14     *        *        *     Request timed out.
 15   444 ms     *      431 ms  66.249.94.2
 16   437 ms     *      433 ms  66.249.95.135
 17   453 ms   452 ms     *     72.14.233.37
 18   446 ms     *        *     72.14.233.27
 19   457 ms   450 ms   452 ms  72.14.239.190
 20     *        *      448 ms  pr-in-f18.google.com [209.85.139.18]

在过了qhu0.cernet.net 后,它们所走的线路不一样了,可能新的路由线路正好避开了受损的海底光缆。听说使用了游戏版教育网直通车的用户访问国外的网络还比较正常,估计也是同样的原因。

两者时延差不多,但是后者丢包率很高(高于50%):
Pinging 209.85.139.18 with 32 bytes of data:
Request timed out.
Request timed out.
Request timed out.
Reply from 209.85.139.18: bytes=32 time=437ms TTL=237
Reply from 209.85.139.18: bytes=32 time=437ms TTL=237
Reply from 209.85.139.18: bytes=32 time=435ms TTL=237
Request timed out.
Request timed out.
Reply from 209.85.139.18: bytes=32 time=434ms TTL=237
Request timed out.
Request timed out.
Request timed out.
Reply from 209.85.139.18: bytes=32 time=449ms TTL=237
Reply from 209.85.139.18: bytes=32 time=436ms TTL=237
Request timed out.
Request timed out.
Reply from 209.85.139.18: bytes=32 time=434ms TTL=237
Reply from 209.85.139.18: bytes=32 time=439ms TTL=237
Request timed out.
Request timed out.
Request timed out.

davies 发表于 2007 年 01 月 10 日 | 0 条留言

Gmail的反垃圾邮件系统

Gmail 的反垃圾邮件系统是目前我所见过的效果最好的,基本上所有垃圾邮件都被顺利地扔到了垃圾箱,误判率很低。

之前一直意味它是基于文本对比和分析实现的,与网页的相适度分析类似,大量相似的邮件判为垃圾邮件。这种方法是很难做到现在这样的效果的,“道高一尺,魔高一丈”,碰到将邮件内容放到图片里的垃圾邮件就没辙了。

其实与很多邮件系统的反垃圾策略类似,Gmail 也是通过白名单和黑名单对邮件发送者进行过滤,同时用基于内容的分析方法辅助判断,只是这个系统级别的黑白名单建立过程不一样。垃圾邮件可定义为用户不期望收到的邮件,垃圾邮件发送者会发送大量用户不想要的邮件,这一行为特征就是反垃圾邮件的依据。

第一步是要正确识别邮件发送者,Gmail 采用域名(不同于以往的IP)为识别单位,通过 SPF 和 DomainKey 等方式来识别邮件来源的域,分析各个域的邮件行为建立信用制度,来自信用度高的域的邮件被认为是正常邮件,放进收件箱;来自信用度的域的邮件则被认为是垃圾邮件,扔进垃圾箱而不是拒绝接收。对于不能判定域的邮件,或者该域的信用度处于中间模糊状态的邮件,则用基于内容的方式做分析,以此作为下一步学习的基础。

域的信用度是通过来自该域的正常邮件所占的百分比来定义,它的值通过用户不断提交误判的垃圾邮件来修正,逐渐趋于合理。训练良好的信用度一般趋于两个极端:极好和极差,通过设定不同信用阈值对邮件是否是垃圾作出判断。

这种以域为单位的信用评判方式,基于一个假定:即来自于同一个域的用户具有相似的行为。这就要求邮件服务提供商对垃圾邮件进行严格的管制,否则部分用户的垃圾行为会影响到正常用户的使用。比如以前163,sina,sohu等免费邮箱经常被人用来发送垃圾邮件,结果很多国外的邮件服务商直接拒绝它们的信件。Gmail 对用户的邮件发送频率进行了限制,似乎是每天300封,限制了被用来发送垃圾邮件的程度。Gmail 的注册也是受限的(目前在大部分地区仍是这样),需要邀请才行,也一定程度上抵制了垃圾邮件。hotmail 等只提供web界面,同样可以限制垃圾邮件的发送。目前的域的判定方法不能很好地区分转发邮件,Gmail 对被判为垃圾邮件的不进行转发,也是在保护它的信用度。

Gmail凭借稳定增长的用户量,以及用户的积极配合区分垃圾邮件,通过对海量数据的合理分析,已经建立起了合理的信用体系,才做到了现在这样的反垃圾效果。

同一封邮件,对不同的用户会有不同的效果,是否为垃圾邮件不能一概而论,因而还需要对每个用户建立特殊的白名单和黑名单,白名单通常是通讯录(被回复的地址会自动加入),黑名单通常是被举报的地址,这个功能在大多数邮件系统里都有了。

理论上,精确到邮件地址的信用制度效果会更好,但是目前来说这个太难实现,邮件帐号实在太多了,现在一个互联网用户经常会有多个邮箱,全世界的邮件地址多大几十亿,对这么大的对象建立信用度是很难的,或许以后可以实现。另一方面,信用度的建立依赖于对大量数据的统计熟悉,而大部分用户的邮件比较少难以获得好的统计效果。

以上只是我个人对 Gmail 的反垃圾系统的理解,更详细的内容请查看 Sender Reputation in a Large Webmail Service

davies 发表于 2007 年 01 月 8 日 | 0 条留言

第 1 / 3 页 | 下一页