主题：【原创】好吧，给一个铁道部订票系统的正确答案 -- 布老虎

共:💬185 🌺732 🌵9 新:

老大河待整

复 2000万美元的确太少，我报个无责任参考价10亿美元

这个想法的核心麻烦在这里

每个省只卖自己出发的车票，意味着订购处理可以放在省一级，每个省自己处理完请求后再统一汇总到中心去

铁路上一个重要的特点是：“从河南郑州到江苏徐州的票有可能是从北京出发终点站在上海”。如果这张票数据放到河南服务器，那么，从北京到郑州的座位就查不到，被浪费了；如果放到北京，那么从河南中心查的话，是查不到这张票的。如果想要避免这两种情况，就必须线路上每一站都放上资源，这又涉及到数据同步问题。如果不想数据同步，就只能所有经停河南的省的服务器都查询一遍，这与数据集中放置到一台服务器的差别不大。上面分析的是读操作部分，在缓存足够大的情况下，这几种方案读效率差不多。现代数据库写是不会阻塞读的（参考数据库的MVCC方案，很多数据库用的都是这个）。

关键问题是写，当多个写操作并发的锁定同一行数据时，只要一个事务被提交，其他的就要全部重来（读已提交）或者回滚（可串行化），大量相互竞争的写操作不断重来回滚，就会耗尽数据库连接资源，最终读的连接也进不去了。最终看似是读失败，实质是写操作阻塞造成的连接失败。

解决这种问题的核心思路就是人为设计一个并发事务串行化队列。无论供应商吹嘘的多么复杂，本质上就是这个。淘宝用开源数据库，某些高并发的地方就是这么干的。

中国不少行业的数据规模都是全球最大最复杂的，比如电信（以至于要分省运营）、铁路（世界负载最高，调度最困难、最乱、最复杂）、证券（金融创新虽不及美国，但小账户、小合约太多，又是世界上最钟爱短线的市场，散户化特征明显）。东部某发达省某银行曾经从印度引进过据称是使用Java先进技术开发的银行业务系统，结果每到高峰时段就会出现10分钟以上的延迟和停摆，断断续续解决了两年没有解决，最后忍无可忍换掉了供应商。印度公司从来没有想到，中国东部一个县的交易量就已经能赶上别人一个国家。

全看分页树展 · 主题跟帖

相关回复上下关系8
压缩 2 层
- 🙂2000万美元的确太少，我报个无责任参考价10亿美元 1 百年字1120 2013-10-20 05:01:28
  - 🙂始发分省好说，中途上车就不好弄了铁手字60 2013-10-26 17:42:49
    🙂哦哟，铁手也回了。其实答案非常简单百年字118 2013-10-27 04:52:59
  - 🙂这个想法的核心麻烦在这里
    🙂关于证券交易，美国那边比我们频繁的多假设字64 2013-11-01 09:38:11
    🙂菜鸟一堆。布老虎字370 2013-10-24 01:01:55
    🙂我这个考虑过了，可能他们没有做那么复杂 1 百年字232 2013-10-22 09:49:25
    🙂这个是正确答案 2 布老虎字692 2013-10-23 01:03:28

有趣有益，互惠互利；开阔视野，博采众长。
虚拟的网络，真实的人。天南地北客，相逢皆朋友

版面群落趣味社区帮助常见问题网站简介基本河规隐私条款使用条款广告说明