GAE出现大规模故障

标签:Google App Engine

目前在GAE的System Status面板还能看到这个公告:
Investigation Complete - Datastore and Serving errors – Python, Java, Datastore, Memcache
Jul 02 2009, 06:20 AM - Jul 02 2009, 12:25 PM
posted by beckmann
On July 2nd, all applications experienced increased error rate and latency with read and write Datastore and memcache operations, as well as some serving errors. Datastore access and serving have been fully restored as of 12:25 PM PDT.
同时,GAE论坛也有进行描述:《Datastore outage July 2, 2009》

这次故障共持续6小时5分钟,主要涉及数据库及memcache的错误,同时波及Python和Java环境。此外我还注意到log中有几处莫名其妙的错误,应该是连Python运行环境本身都出错了。

最后想说的是,虽然这次故障已恢复,但可能由于使用人数的增加,GAE的服务已经越来越不可靠了。
本周Urlfetch每天都处于Investigating状态(导致我错过了2次KFC的红包),Serving、Datastore和Memcache这种最为基本的服务也有约一半的时间故障。
最初使用GAE时,基本上一周难得发生一次故障,看来GAE团队不得不面对这个问题了。

0条评论 你不来一发么↓

    想说点什么呢?