Anticipation is brewing for Google’s big April 1st (April Fools) announcement this year and since GMail was first launched on April 1st, some are expecting Google to make some big changes.

It appears however that Google has already made some tweaks to GMail, in the form of storage space.
Google has updated the GMail code to calculate 5 years into the future, stopping at 3.47 GB.
导语:北京时间3月30日,国外媒体近日发表分析文章称,为了逐步摆脱对互联网广告业务的依赖,Google(谷歌)正全力进军线下广告市场,包括电视广告、报纸广告和广播广告。但到目前为止,Google的进展并不顺利。
国外媒体报道,谷歌(Google)翻译业务主管弗朗茨·奥奇(Franz Och)近日表示,通过谷歌开发的机器翻译软件,公众今后将可把文档很快翻译成世界各主要语种材料。与传统即时翻译软件不同,谷歌即时翻译采用了统计学式的机器翻译方式。
奥奇称,传统翻译软件的工作原理是,由语言学专家把语法规则及字典所收词条输入到计算机中。而谷歌所采取的方式是,将人们已翻译过的文档放 置到两种语言中去,然后由计算机来识别新翻译任务所适合的模式。尽管谷歌即时翻译的质量仍不完美,但与传统机器翻译方式相比已是重大进步;对于一些翻译材 料而言,大部分正确的翻译结果可谓已相当不错。
奥奇表示,如果使用谷歌翻译把阿拉伯文网络新闻转换成英文,熟悉英语者便能很容易读懂。两位本族语为俄语的谷歌员工表示,使用谷歌翻译把一段英文转 换成俄文后,虽然也能理解其大致意思,只是读起来有点拗口。奥奇对此表示,谷歌翻译所存储已翻译过的语种材料越多,翻译结果的准确性就越高。
奥奇称,目前谷歌已在www.google.com/language_tools上提供了自家机器翻译工具,可来回转换翻译的语种包括阿拉伯语、汉语、俄语及英语。该网站上的第三方翻译软件还包括德语及其他语种。
有的网赚公司是以支票支付的,那么从国外收到支票后怎么处理呢?
从邮递员手中拿到支票后,必须通过银行托收,才能帮你把钱领回来。具体做法如下:
①、从邮递员手中拿到支票后,拿着支票和您的身份证到当地的中国银行办理。
②、一般在中国银行的外币科或外币部门的柜台前办理托收手续,别忘了填写您的联系电话。
③、您需要向中国银行交一定的手续费和支票的邮寄费,所收费用根据各地情况而不同。邮寄费一般为15~30元人民币不等,手续费一般为支票金额的0.1%(此费最少也得交10元人民币)。
④、将收据收好,等大约1个月左右银行会电话通知您款已到帐。
⑤、拿着您的收据和身份证再到外币柜台,这时您就可以见到您的美元了!(注:有的银行会要求你将存款存三个月,这样的话,手续费会低一些)
相关疑问:
1、只要英文地址正确,从国外广告赞助商那里寄出的支票大概需要两个星期就可以收到。如果1个月后,仍没有收到支票,就要写信告诉广告赞助商,请求重新邮寄。
2、收到支票后,应到中国银行县级以上分行,请求帮助托收支票。银行将为你办理1张3个月的美元定期存折,但要收取0.7%的托收费用。这个费用是从支票上扣除。另外,由于银行要验证支票的真伪,所以美元定期存折要冻结3个月,不能提前支取。
3、1个月后,可到银行询问托收是否成功。
4、3个月后可提取美金。
5、从加入赚钱网站到真正可以支配赞助费,最少要5个月的时间。
6、支票有期限吗?有,一般为3-6个月左右。如支票上注明则按其注明日期,如“void after 90 days”是指从出票日期算起90天内托收有效。总之,收到支票要尽快办理托收。
7、收到了支票后帐号被删除了,那还能托收并收到钱吗?能,绝大多数情况下都还能收到钱。除非他要求银行退票,不过这种情况极少发生。
The Google Dance Tool is provided as a tool to help you, the webmaster, determine when the Google search engine is spidering the internet. This is extremely useful if you want to know when your site(s) will rank in Google.
The name Google Dance is a term used to describe the index update of the Google search engine. By using the Google Dance Tool below, you can easily determine if Google has started their monthly spidering of the internet. Type in a keyword you would like to search for and choose some of Google's data centers to perform the search query on. You will then see a page displaying the search results of all the Google data centers you have chosen. If any of the results between the different data centers contain discrepencies, then you know that Google has started to spider.
We have also written a nice little script that is FREE for you to use that has deamed itself useful. With the use of the Google Web API, it is now possible to perform search queries on the Google search engine to find information concerning a variety of information. These include how many sites link to yours site, search results on any particular keyword, your site's ranking in Google, and much more.
撰文/Sergey Brin. Lawrence Page 翻译/万思
文章来自《程序员》
英文原文可以在这里找到http://dev.csdn.net/develop/article/12/12657.shtm
关键字:WWW 搜索引擎 网络爬虫 PageRank Google
作为一种功能强大的搜索引擎,Googic的背后似乎隐藏着巨大的奥秘,本文是Googic的两位创始人在1998年国际互联网大会上发表的论文,通过对Google进行完整地剖析,帮助读者理解Google的实现过程。
4.3抓网页运行
网络爬行机器人是一项具有挑战性的任务。执行的性能和可靠性甚至更重要,还有一些社会焦点。网络爬行是一项非常薄弱的应用,它需要成百上千的web服务器 和各种域名服务器的参与,这些服务器不是我们系统所能控制的。为了覆盖几十亿的网页,Google拥有快速的分布式网络爬行系统。一个URL服务器给若干 个网络爬行机器人(我们采用3个)提供URL列表。URL服务器和网络爬行机器人都是用Python实现的。每个网络爬行机器人可以同时打开300个链 接。抓取网页必须足够快。最快时,用4个网络爬行机器人每秒可以爬行100个网页。速率达每秒600K。执行的重点是找DNS。每个网络爬行机器人有它自 己的DNS cache,所以它不必每个网页都查DNS。每一百个连接都有几种不同的状态:查DNS,连接主机,发送请求,接收回答。这些因素使网络爬行机器人成为系 统比较复杂的部分。它用异步IO处理事件,若干请求队列从一个网站到另一个网站不停的抓取网页。运行一个链接到500多万台服务器的网页爬行机器人,产生 1千多万登陆口,导致了大量的Email和电话。因为网民众多,总有些人不知道网络爬行机器人是何物,这是他们看到的第一个网络爬行机器人。几乎每天我们 都会收到这样的Email“哦,你从我们的网站看了太多的网页,你想干什么?”还有一些人不知道网络搜索机器人避免协议(the robots exclusion protocol),以为他们的网页上写着“版权所有,勿被索引”的字样就会被保护不被索引,不必说,这样的话很难被web crawler理解。因为数据量如此之大,还会遇到一些意想不到的事情。例如,我们的系统曾经企图抓一个在线游戏,结果抓到了游戏中的大量垃圾信息。解决 这个问题很简单。但是我们下载了几千万网页后才发现了这个问题。因为网页和服务器的种类繁多,实际上不在大部分Internet上运行它就测试一个网页爬 行机器人是不可能。总是有几百个隐含的问题发生在整个web的一个网页上,导致网络爬行机器人崩溃,或者更糟,导致不可预测的不正确的行为。能够访问大部 分Internet的系统必须精力充沛并精心测试过。由于象crawler这样大型复杂的系统总是产生这样那样的问题,因此花费一些资源读这些 Email,当问题发生时解决它,是有必要的。
《The Anatomy of a Large-Scale Hypertextual Web Search Engine》
这篇文章中,我们介绍了google,它是一个大型的搜索引擎(of a large-scale search engine)的原型,搜索引擎在超文本中应用广泛。Google的设计能够高效地抓网页并建立索引,它的查询结果比其它现有系统都高明。这个原型的全文 和超连接的数据库至少包含24000000个网页。我们可以从http://google.stanford.edu/ 下载。
设计搜索引擎是一项富有挑战性的工作。搜索引擎为上亿个网页建立索引,其中包含大量迥然不同的词汇。而且每天要回答成千上万个查询。在网络中,尽管大型搜 索引擎非常重要,但是学术界却很少研究它。此外由于技术的快速发展和网页的大量增加,现在建立一个搜索引擎和三年前完全不同。
Google的服务确实很爽,但是还没有到你想要出国使用的程度吧?不知道我说的这个功能能否让你有出国使用Google服务的冲动。
首先,Google应该推出自己的手机,连Yahoo都推出自己的鼠标键盘了。名字我想就叫Google Phone或者Gphone吧。最大的卖点就是内置所有的Google服务,最重要的比如Google Talk, Gmail, Googl Reader, Google Calendar, Google Groups, Blogger等等,并且实现所有功能的完美结合。
译按:这篇译文介绍了十个AdSense工具,如果你的网站已经有了一定流量和规模,但广告收入一直不理想,以下的工具和建议值得参考。
[原文作者]:Nick
[原文地址]:Top 10 Adsense Tools
翻译:lucifr.com
翻译地址:http://lucifr.com/2006/09/15/top-10-adsense-tools/
开门见山,这篇文章的本意就是为了介绍几个能帮助您掌握Goolge Adsense的最好的工具。不过,我还是从我个人的喜好出发,把这些工具按照其实用性排了一下顺序(因为比出个高低真不是那么容易-全看你怎么使用)。