2025 年 10 月 20 日凌晨,亚马逊云服务(AWS)美国东部-1(us-east-1)区域发生严重故障,导致大量依赖该区域的互联网服务中断数小时。AWS 已确认问题根源,并观察到恢复迹象,但完全恢复正常仍需时间。
故障原因:DynamoDB 的 DNS 解析异常
- 时间线:
- 凌晨 3:00(美东时间):AWS 首次通报 us-east-1 区域多个服务出现“错误率上升与延迟增加”。
- 约 4:30:确认 DynamoDB API 端点存在“显著错误率”。
- 5:00:定位根本原因为 DynamoDB 端点的 DNS 解析故障,并指出该问题已波及其他依赖 us-east-1 的 AWS 服务(如 IAM、DynamoDB 全球表等)。
- 5:20:AWS 应用缓解措施,称已看到“显著恢复迹象”,但积压请求仍需处理。
AWS 建议用户“继续重试失败的请求”,并提醒在此期间可能无法创建或更新支持工单。
受影响的主流服务(部分)
此次宕机引发连锁反应,波及全球大量高流量平台,包括:
- 社交与通信:Snapchat、Signal、Zoom、Reddit
- 游戏与娱乐:Roblox、Fortnite、PlayStation Network、Steam、Pokémon Go
- 流媒体:HBO Max、Disney+、Hulu、Roku
- 金融与生活:Venmo、Robinhood、Lyft、麦当劳 App
- 智能设备:Amazon Alexa、Ring
- 电信运营商:AT&T、Verizon、T-Mobile(部分服务)
- AI 服务:Perplexity
为何影响如此广泛?
us-east-1 是 AWS 最早、最大、使用最广泛的区域,承载了大量全球性应用的核心服务。许多公司即使部署在多区域,其身份认证(IAM)、数据库(DynamoDB)或控制平面仍依赖 us-east-1,导致单点故障引发全局中断。
0条评论