当前位置:文档之家› 淘宝技术架构发展总结

淘宝技术架构发展总结

淘宝技术架构发展总结
淘宝技术架构发展总结

从个人到淘宝网仰观Java时代淘宝的技术发展(1)

引言

光棍节的狂欢

“时间到,开抢!”坐在电脑前早已等待多时的小美一看时间已到2011年11月11日零时,便迫不及待地投身于淘宝商城一年一度的大型网购促销活动——“淘宝双11购物狂欢节”。小美打开早已收藏好的宝贝——某品牌的雪地靴,飞快的点击购买,付款,一回头发现3000双靴子已被抢购一空。

小美跳起来,大叫一声“欧耶!”

小美不知道,就在11日零点过后的这一分钟,全国有342万人和她一起涌入淘宝商城。当然,她更不知道,此时此刻,在淘宝的一间办公室里,灯火通明,这里是“战时指挥部”,淘宝技术部的一群工程师,正在紧盯着的流量和交易数据。白板上是他们刚刚下的注,赌谁能最准确地猜中流量峰值和全天的交易总额。他们的手边放着充足的食物和各类提神的饮料。

一阵急促的声响起来,是前线部门询问数据的,工程师大声报着:“第1分钟,进入淘宝商城的会员有342万”。过一会工程师主动拿起:“交易额超过1亿了,现在是第8分钟。”接下来,“第21分钟,刚突破2亿”。“第32分钟,3亿了”。“第1个小时,4.39亿”。这些数据随后出现在微博上,引起一片惊呼。

“完蛋了!”突然有人大喝一声,所有的眼睛都紧的盯着他,只见他挠挠头,嘿嘿的笑道“我赌的少了,20亿轻松就能过了,我再加5亿”,他跑去白板边上把自己的赌注擦去,写上25,接下来有人写上28,有人写上30,有人跑到微博上开下盘口,同事们纷纷下注。接下来的这24个小时,战时指挥部的工程师们都不能休息,他们盯着的各种监控指标,适时的调整机器和增减功能。顶住第一波高峰之后,这些人开始忙里偷闲的给自己买东西,大家互相交流着哪家买的移动硬盘靠谱,哪家衣服适合自己的女朋友,不时的有人哀嚎宝贝被人抢了、信用卡额度不够了。同时,旁边白板上的赌注越下越大。

11月11日,这个棍子最多的日子被网民自我调侃的变成了一个节日——“光棍节”。而淘宝网又用疯狂的折扣促销给它赋予了另外一个意义——“购物狂欢节”。2011年11月11日这一天,淘宝商城与淘宝网交易额之和突破52亿,这个数字是“购物天堂”香港一天零售总额8.5亿的6倍。

网民感受到的是疯抢的喜悦,而的技术人员感受到的却是“压力山大”。就如同你家办酒席,宴请左邻右舍,这个办起来容易。倘若宴请十里八乡所有的人,吃饭的人自然开心,但却不是一般人家能够办得起来的。能办得起来如此盛宴者,需要强大的财力物力、组织能力、技术实力(例如做这么多菜,你的炒锅一定要是“分布式的”、“可复制的”、“可扩展的”,洗菜切菜要有“工作流引擎”,上菜的路径要用图论来计算出来,甚至连厨房的下水道都要重新设计)。

淘宝能够举办如此盛宴,的技术实力可见一斑。淘宝网拥有全国最大的hadoop分布式计算集群之一,日新增数据50TB,有40PB海量数据存储。分布在全国各地80多个节点的CDN网络,支持的流量超过800Gbps。淘宝的搜索引擎能够对数十亿的商品数据进行实时搜索,另外还拥有自主研发的文件存储系统和缓存系统,以及java中间件和消息中间件系统,这一切组成了一个庞大的电子商务操作系统。另外从商业数据上来看,AMAZON的财报显示2011年完成了大约480亿美金的交易额,EBAY2011年财报全年完成了大约600亿美金的交易额(不包括其独立的汽车交易平台)。不管从交易额、商品数量、同比增速

等指标上看,淘宝网均远超于此,是目前全球最大的电子商务平台。(由于淘宝非上市公司,未公布2011年业绩,以上容来自淘宝网技术副总裁@_行癫的微博)

以上这些技术数据可能已经让一些同学产生不适的感觉,为了让更多的人读懂这本书,我们从技术的角度来看,小美访问淘宝网的时候,上发生了什么事情。下参考资料:《你刚才在淘宝上买了一件东西【技术普及帖】》,来自邮电大学放同学

为了有个更直观的对比,我们说一个同行,他在2011年光棍节之前做促销,流量上去之后,达到12Gbps (他们有这么大的流量,老板很高兴,在微博上面说了这个数据),这时候流量达到了极限,几乎挂掉,用户无法下订单。而淘宝网光棍节当天网络的流量最高达到800多Gbps,带给各家银行和快递公司的流量也让他们压力山大,如临大敌(后来,他们以能够撑住淘宝带来的流量为荣而到处宣传)。另外如果你在网上购买过火车票的话,更能体会到能支持多大的流量有多重要。但这不是一朝一夕做出来的,也不是有钱就能办到的。

以上对比的这些,也许读者很容易就猜到是哪一家,这里拿出来作对比,绝对没有嘲笑人家的意思,采用通常的技术方案,能做到这种程度已经不错了。任何的发展都不是一蹴而就的,在什么样的阶段采用什么样的技术。在发展的过程中会遇到各种各样的问题和业务带来的压力,正是这些原因才推动着技术的进步和发展,而技术的发展又会反过来促进业务的更大提升。二者互为因果,相互促进。如今淘宝网的流量已经是全球排名第12、国排名第3(美国的ebay全球排名23,国前两名是百度和腾讯)。淘宝网的系统也从使用一台服务器,到采用万台以上的服务器。本书就为大家描述淘宝网在整个发展过程中,所有的主动和被动的技术变革的前因后果,这由很多有趣的故事组成。

正如同很多人或组织成功了以后,就会为自己的出身编造一个美丽的传说。淘宝网的出身,网上也有非常多的传说,下面我们就从它的出生开始讲起。

个人

2003年4月7日,马云,在,成立了一个神秘的组织。他叫来十位员工,要他们签了一份协议,这份协议要求他们立刻离开阿里巴巴,去做一个神秘的项目。这个项目要求绝对保密,老马戏称“连说梦话被老婆听到都不行,谁要是透漏出去,我将追杀到天涯海角”。这份协议是英文版的,匆忙之间,大多数人根本来不及看懂,但出于对老马的信任,都卷起铺盖离开了阿里巴巴。

他们去了一个神秘的据点——湖畔花园小区的一套未装修的房子里,房子的主人是马云。这伙人刚进去的时候,马云给他们布置了一个任务,就是在最短的时间做出一个个人对个人(C2C)的商品交易的。现在出一个问题考考读者,看你适不适合做淘宝的创业团队。亲,要是让你来做,你怎么做?

在说出这个答案之前,容我先卖个关子,介绍一下这个创业团队的成员:三个开发工程师(虚竹、三丰、多隆)、一个UED(二当家)、三个运营(小宝、阿珂、破天)、一个经理(财神)、还有就是马云和他的秘书。当时对整个项目组来说压力最大的就是时间,怎么在最短的时间把一个从来就没有的从零开始建立起来?了解淘宝历史的人知道淘宝是在2003年5月10日上线的,这之间只有一个月。要是你在这个团队里,你怎么做?我们的答案就是:买一个来。

买一个显然比做一个要省事一些,但是他们的梦想可不是做一个小而已,要做大,就不是随便买个就行的,要有比较低的维护成本,要能够方便的扩展和二次开发。那接下来就是第二个问题:买一个什么样的?答案是:轻量一点的,简单一点的,于是买了这样一个架构的:LAMP(linux+apache+mySQL+PHP)。这个直到现在还是一个很常用的架构模型。这种架构的优点是:无需编译,发布快速,PHP功能强大,能做从页面渲染到数据访问所有的事情,而且用到的技术都是开源的,免费。

当时我们是从一个美国人那里买来的一个系统,这个系统的名字叫做PHPAuction(他们的官

方https://www.doczj.com/doc/b87326847.html, 这个名字很直白,一眼就看出来这个系统是用什么语言做的、是干什么用的),PHPAuction有好几个版本,我们买的是最高版的,功能比较多,而且最重要的是对方提供了源代码。最高版比较贵,花了我们2000美金(貌似现在降价了,只要946美元)。买来之后不是直接就能用的,需要很多本地化的修改,例如页面模板改的漂亮一点,页头页脚加上自己的站点简介等,其中最有技术含量的是对数据库进行了一个修改。原来是从一个数据库进行所有的读写操作,拿过来之后多隆把它给拆分成一个主库、两个从库,读写分离。这么做的好处有几点:存储容量增加了,有了备份,使得安全性增加了,读写分离使得读写效率提升了。这样整个系统的架构就如下图所示:

其中pear DB是一个PHP模块,负责数据访问层。另外也用开源的论坛系统PHPBB(.phpbbchina. )搭建了一个小的论坛社区,虚竹负责机器采购、配置、架设等,三丰和多隆负责编码,他们把交易系统和论坛系统的用户信息打通,给运营人员开发出后台管理(admin系统)的功能,把交易类型从只有拍卖这一种增加为拍卖、一口价、求购商品、海报商品(意思是还没推出的商品,先挂个海报出来)这四种。(PHPAuction只有拍卖的交易,Auction即拍卖的意思。@_行癫在微博中提到:今天eBay所有交易中拍卖交易仍然占了40%,而在中国,此种模式在淘宝几乎从一开始就未能占据优势,如今在主流的交易中几乎可以忽略不计。背后的原因一直令人费解。我大致可以给出其中一种解释,eBay基本在发达展开业务,制造业外包后,电子商务的基本群体大多只能表现为零散的个体间交易。)

在经历了另外一些有趣的事情之后(这些有趣的事情包括“淘宝”这个名字的由来,员工花名的由来等等,由于本书主要描述技术方面的故事,对这些有兴趣的可以去网上找),开始上线运行了。

在接下来的大半年时间里,这个迅速显示出了它的生机。这里有必要提一下当时的市场环境,非典(SARS)的肆虐使得大家都不敢出门,尤其是去商场之类人多的地方。另外在神州大地上最早出现的C2C易趣也正忙的不亦乐乎,2002年3月,eBay以3000万美元收购了易趣公司33%的股份,2003年6月以1.5亿美元收购了易趣公司剩余67%的股份。当时淘宝网允许买卖双方留下联系方式,允许同城交易,整个操作过程简单轻松。而eBay为了收取交易佣金,是禁止这么做的,这必然增加了交易过程的难度。而且eBay 为了全球统一,把易趣原来的系统替换成了美国eBay的系统,用户体验一下子全变了,操作起来非常麻烦,这等于是把积累的用户拱手送给了淘宝。为了不引起eBay的注意,淘宝网在2003年里一直声称自己是一个“个人”。由于这个创业团队强大的市场开拓和运营能力,淘宝网发展的非常迅猛,2003年底就吸引了注册用户XXX,最高每日31万PV,从5月到年底成交额4000万。这没有引起eBay的注意,却引起了阿里巴巴部很多员工的注意,他们觉得这个以后会成为阿里巴巴强劲的对手。甚至有人在网发帖,忠告管理层要警惕这个刚刚起步的,但管理层似乎无动于衷。(这个团队的保密工作做的真好)

在市场和运营的后方,淘宝网的技术团队也在快速的做着系统的改进和创新。这里还有个有趣的故事,eBay 和易趣早期都有员工在论坛上响应用户的需求,eBay的论坛用粉红色背景来区分员工的发言,易趣的员工在论坛上昵称都选各种豆豆,例如黄豆豆、蚕豆豆等。淘宝在讨论运营策略的时候提到这个问题,要求所有的员工都去论坛上回答用户的问题。最早回答问题的任务落在小宝头上,那我们用什么名字好呢?“淘

淘”?“宝宝”?小宝都不满意,太女性化了。讨论了很久之后,小宝灵光乍现,干脆取个名字叫“小宝”吧,小宝带七个老婆来开店,迎接各位客官,很有故事性。于是很多武侠小说中的人物开始在论坛中行侠仗义,这些昵称下面标志着“淘宝店小二”,他们回答着各种各样的问题,快速响应着用户的各种需求。如果是技术上能解决的,几个人商量一下,马上就开发、测试、发布上线。反过来对比一下,易趣被eBay 收购之后,系统更换成了全球通用的版本,响应用户的一个需求需要层层审批,反应速度自然慢了下来。

当时淘宝第一个版本的系统里面已经包含了商品发布、管理、搜索、商品详情、出价购买、评价投诉、我的淘宝这些功能(现在主流程中也是这些模块。在2003年10月增加了一个功能节点:“安全交易”,这个是支付宝的雏形)。随着用户需求和流量的不断增长,系统上面做了很多的日常改进,服务器由最初的一台变成了三台,一台负责发送email、一台负责运行数据库、一台负责运行webApp。过一段时间之后,商品搜索的功能占用数据库资源太大了(用like搜索的,很慢),又从阿里巴文站搬过来他们的搜索引擎iSearch,起初iSearch索引的文件放在硬盘上,随着数据量的增长,又采购了NetApp服务器放置iSearch。

如此快节奏的工作,其实大家都累得不行,有人就提议大家随时随地的锻炼身体,可是外面SARS横行,在一个一百多方的房子里,怎么锻炼呢?高挑美女阿珂提议大家练习提臀操,这个建议遭到男士的一致反对,后来虚竹就教大家练习倒立,这个大家都能接受。于是这个倒立的传统一直延续至今,和花名文化、武侠文化一并传承了下来。

随着访问量和数据量的飞速上涨,问题很快就出来了,第一个问题出现在数据库上。mySQL当时是第4版的,我们用的是默认的存储引擎myisam,这种类型读数据的时候会把表锁住(我们知道Oracle在写数据的时候会有行锁,读数据的时候是没有的),尤其是主库往从库上面写数据的时候,会对主库产生大量的读操作,使得主库性能急剧下降。这样在高访问量的时候,数据库撑不住了。另外当年的mySQL不比如今的mySQL,在数据的容量和安全性方面也有很多先天的不足(和Oracle相比)。

Oracle/支付宝/旺旺

淘宝网作为个人发展的时间其实并不长,由于它太引人注目了,马云在2003年7月就宣布了这个是阿里巴巴旗下的,随后在市场上展开了很成功的运作。最著名的就是利用中小来做广告,突围eBay在门户上对淘宝的广告封锁。上网比较早的人应该还记得那些在右下角的弹窗和腰封上一闪一闪的广告。市场部那位到处花钱买广告的家伙,太能花钱了,一出手就是几百万,他被我们称为“大少爷”。

“大少爷”们做的广告,带来的就是迅速上涨的流量和交易量。在2003年底,MySQL已经撑不住了,技术的替代方案非常简单,就是换成Oracle。换Oracle的原因除了它容量大、稳定、安全、性能高之外,还有人才方面的原因。在2003年的时候,阿里巴巴已经有一支很强大的DBA团队了,有冯春培、汪海(七

公)这样的人物,后来还有冯大辉(@fenng)、吉平(拖雷)。这样的人物牛到什么程度呢?Oracle给全球的技术专家颁发一些头衔,其中最高级别的叫ACE(就是扑克牌的“尖儿”,够大的吧),被授予这个头衔的人目前全球也只有300多名(在这里:http://apex.oracle./pls/otn/f?p=19297:3 ),当年全球只有十几名。有如此强大的技术后盾,把MySQL换成Oracle是顺理成章的事情。

但更换数据库不是只换个库就可以的,访问方式,SQL语法都要跟着变,最重要的一点是,Oracle并发访问能力之所以如此强大,有一个关键性的设计——连接池。但对于PHP语言来说它是放在Apache上的,每一个请求都会对数据库产生一个连接,它没有连接池这种功能(java语言有servlet容器,可以存放连接池)。那如何是好呢?这帮人打探到eBay在PHP下面用了一个连接池的工具,是BEA卖给他们的。我们知道BEA的东西都很贵,我们买不起,于是多隆在网上寻寻觅觅,找到一个开源的连接池代理服务SQL Relay(http://sourceforge.jp/projects/freshmeat_sqlrelay ),这个东西能够提供连接池的功能,多隆对它进行了一些功能改进之后就拿来用了。这样系统的架构就变成了如下的样子:

数据一开始是放在本地的,DBA们对Oracle做调优的工作,也对SQL进行调优。后来数据量变大了,本地存储不行了。买了NAS(Network Attached Storage:网络附属存储),NetApp的NAS存储作为

了数据库的存储设备,加上Oracle RAC(real application clusters,实时应用集群)来实现负载均衡。七公说这实际上是走了一段弯路,NAS的NFS(Network File System)协议传输的延迟很严重,但那时侯不懂。后来采购了dell和EMC合作的SAN低端存储,性能一下子提升了10几倍,这才比较稳定了。再往后来数据量更大了,存储的节点一拆二、二拆四,RAC又出问题了。这才踏上了购买小型机的道路。在那段不稳定的时间里,七公曾经在机房住了5天5夜。

替换完数据库,时间到了2004年春天,俗话说“春宵一刻值千金”,但这些人的春宵却不太好过了。他们在把数据的连接放在SQL Relay之后就噩梦不断,这个代理服务经常会死锁,如同之前的MySQL死锁一样。虽然多隆做了很多修改,但当时那个版本部处理的逻辑不对,问题很多,唯一解决的办法就是“重启”它的服务。这在白天还好,连接上机房的服务器,把进程杀掉,然后开启就可以了,但是最痛苦的是它在晚上也要死掉,于是工程师们不得不24小时开着手机,一旦收到“SQL Relay进程挂起”的短信,就从春梦中醒来,打开电脑,连上机房,重启服务。后来干脆每天睡觉之前先重启一下。做这事最多的据说是三丰,他现在是淘宝网的总裁。现在我们知道,任何牛B的人物,都有一段苦B的经历。

微博上有人说“好的架构是进化来的,不是设计来的”。的确如此,其实还可以再加上一句“好的功能也是进化来的,不是设计来的”。在架构的进化过程中,业务的进化也非常迅猛。最早的时候,买家打钱给卖家都是通过银行转账汇款,有些骗子收了钱却不发货,这是一个很严重的问题。然后这伙人研究了paypal 的支付方式,发现也不能解决问题。后来这几个聪明的脑袋又想到了“担保交易”这种第三方托管资金的办法。于是在2003年10月,淘宝网上面上线了一个功能,叫做“安全交易”,卖家选择支持这种功能的话,买家会把钱交给淘宝网,等他收到货之后,淘宝网再把钱给卖家。这就是现在的支付宝,在前两天(2012.2.21)年会上,支付宝公布2011年的交易笔数已经是paypal的两倍。这个划时代的创新,其实就是在不断的思索过程中的一个灵光乍现。

当时开发“安全交易”功能的是茅十八和他的徒弟苗人凤(茅十八开发到一半去上海读MBA去了,苗人凤现在是支付宝的首席业务架构师),开发跟银行网关对接的功能的是多隆。当时多数银行的已经支持在线支付了,但多隆告诉我,他们的网关五花八门,用什么技术的都有,必须一家一家去接。而且他们不保证用户付钱了就一定扣款成功、不保证扣款成功了就一定通知淘宝、不保证通知淘宝了就一定能通知到、不保证通知到了就不重复通知。这害苦了苗人凤,他必须每天手工核对账单,对不齐的话就一定是有人的钱找不到地方了,少一分钱都睡不着觉。另外他为了测试这些功能,去所有的银行都办理了一银行卡。一堆银行卡摆在桌子上,不知道的人还以为这个家伙一定很有钱,其实里面都只是十块八块的。现在我们再一次知道,任何牛B的人物,都必须有一段苦B的经历。

有人说淘宝打败易趣(eBay中国)是靠免费,其实这只是原因之一。如果说和易趣过招第一招是免费的话,这让用户没有门槛就愿意来,那第二招就是“安全支付”,这让用户放心付款,不必担心被骗。在武侠小说中真正的高手飞花摘叶即可伤人,他们不会局限于一招两招,一旦出手,连绵不绝。而淘宝的第三招就是“旺旺”。其实淘宝旺旺也不是自己生出来的,是从阿里巴巴的“贸易通”复制过来的。从2004年3月开始,“叮咚、叮咚”这个经典的声音就回荡在所有淘宝买家和卖家的耳边,“亲,包邮不?”“亲,把零头去掉行不?”这亲切的砍价声造就了后来的“淘宝体”。有人说中国人就是爱砍价,虽然笔者体会不到砍价成功后有多少成就感,但每次我去菜市场,看到大妈们砍价砍得天昏地暗,那满足的劲头堪比捡到了钱,我就深刻的理解了淘宝旺旺在交易过程中的价值。我猜eBay也体会不到砍价的乐趣,他们一直不允许买卖双方在线聊天,收购了skype之后也没有用到电子商务中去。

旺旺在推出来没多久,就惹了一个法律方面的麻烦。有个做雪饼的厂家找上门来,说我们侵权了,他们家的雪饼很好吃,牛奶也做得不错,我们都很喜欢。然后我们就在旺旺的前面加了两个字,叫做“淘宝旺旺”。在那个野蛮生长的阶段,其实很多产品都是想到什么就做什么,例如我们还搭建过一个聊天室,但似乎淘宝网不是一个闲聊的地方,这个聊天室门可罗雀,一段时间后就关闭掉了。

SQL Relay的问题搞得三丰他们很难睡个囫囵觉,那一年开半年会的时候,公司特地给三丰颁了一个奖项,对他表示深切的安慰。但不能总这样啊,于是,2004年的上半年开始,整个就开始了一个脱胎换骨的手术。

我的师父黄裳@岳旭强曾经说过,“好的架构图充满美感”,一个架构好不好,从审美的角度就能看得出来。后来我看了很多系统的架构,发现这个言论基本成立。那么反观淘宝前面的两个版本的架构,你看哪个比较美?

显然第一个比较好看,后面那个显得头重脚轻,这也注定了它不是一个稳定的版本,只存活了不到半年的时间。2004年初,SQL Relay的问题解决不了,数据库必须要用Oracle,那从哪里动刀?只有换开发语言了。换什么语言好呢?Java。Java是当时最成熟的开发语言,它有比较良好的企业开发框架,被世界上主流的大规模普遍采用,另外有Java开发经验的人才也比较多,后续维护成本会比较低。

到2004年上半年,淘宝网已经运行了一年的时间,这一年积累了大量的用户,也快速的开发了很多功能,当时这个已经很庞大了,而且新的需求还在源源不断的过来。把一个庞大的的开发语言换掉,无异于脱胎换骨,在换的过程中还不能拖慢业务的发展,这无异于边换边跑,对时间和技术能力的要求都非常高。做这样的手术,需要请第一流的专家来主刀。现在再考一下读者,如果你在这个创业团队里面,请什么样的人来做这事?我们的答案是请Sun的人。没错,就是创造Java语言的那家公司,世界上没有比他们更懂Java的了。除此之外,还有一个不为人知的原因,……(此处和谐掉200字,完整版见aliway)

这帮Sun的工程师的确很强大,在笔者2004年底来淘宝的时候,他们还在,有幸跟他们共事了几个月。现在摆在他们面前的问题是用什么办法把一个庞大的从PHP语言迁移到Java?而且要求在迁移的过程中,不停止服务,原来系统的bugfix和功能改进不受影响。亲,你要是架构师,你怎么做?有人的答案是写一

个翻译器,如同把中文翻译成英文一样,自动翻译。我只能说你这个想法太超前了,换个说法就是“too simple, sometimes naive”。当时没有,现在也没有人能做到。他们的大致方案是给业务分模块,一个模块一个模块的替换。如用户模块,老的https://www.doczj.com/doc/b87326847.html,继续维护,不添加新功能,新的功能先在新的模块上开发,跟老的共用一个数据库,开发完毕之后放到不同的应用集群上,另开个域名member1.taobao.,同时替换老的功能,替换一个把老的模块上的功能关闭一个,逐渐的把用户引导到member1.taobao.,等所有功能都替换完毕之后,关闭member.taobao.。后来很长时间里面都是在用member1这样奇怪的域名,两年后有另外一家互联网公司开始做电子商务了,我们发现他们的域名也叫member1.xx.、auction1.xx.……

说了开发模式,再说说用到的Java MVC框架,当时的struts1.x是用的比较多的框架,但是用过webwork 和struts2的同学可能知道,struts1.x在多人协作方面有很多致命的弱点,由于没有一个轻量框架作为基础,因此很难扩展,这样架构师对于基础功能和全局功能的控制就很难做到。而阿里巴巴的18个创始人之中,有个架构师,在Jakarta Turbine的基础上,做了很多扩展,打造了一个阿里巴巴自己用的MVC框架WebX (https://www.doczj.com/doc/b87326847.html,/docs/Webx3_Guide_Book.html ),这个框架易于扩展,方便组件化开发,它的页面模板支持JSP和velocity等、持久层支持ibatis和hibernate等、控制层可以用EJB和Spring(Spring 是后来才有的)。项目组选择了这个强大的框架,这个框架如果当时开源了,也许就没有webwork和struts2什么事了。另外,当时Sun在全世界大力推广他们的EJB,虽然淘宝的架构师认为这个东东用不到,但他们还是极力坚持。在经历了很多次的技术讨论、争论和争吵之后,这个系统的架构就变成了下图的样子:

Java应用服务器是Weblogic,MVC框架是WebX、控制层用了EJB、持久层是ibatis,另外为了缓解数据库的压力,商品查询和店铺查询放在搜索引擎上面。这个架构图是不是好看了一点了,亲?

这帮Sun的工程师开发完淘宝的之后,又做了一个很牛的,叫“支付宝”。

其实在任何时候,开发语言本身都不是系统的瓶颈,业务带来的压力更多的是压到了数据和存储上。上面一篇也说到,MySQL撑不住了之后换Oracle,Oracle的存储一开始在本机上,后来在NAS上,NAS撑不住了用EMC的SAN存储,再然后Oracle的RAC撑不住了,数据的存储方面就不得不考虑使用小型机了。在2004年的夏天,DBA七公、测试工程师郭芙和架构师行癫,踏上了去北京测试小型机的道路。他们带着小型机回来的时候,我们像欢迎领袖一样的欢迎他们,因为那个是我们最值钱的设备了,价格表

上的数字吓死人。小型机买回来之后我们争相合影,然后Oracle就跑在了小型机上,存储方面从EMC低端cx存储到Sun oem hds高端存储,再到EMC dmx高端存储,一级一级的往上跳。

到现在为止,我们已经用上了IBM的小型机、Oracle的数据库、EMC的存储,这些东西都是很贵的,那些年可以说是花钱如流水啊。有人说过“钱能解决的问题,就不是问题”,但随着淘宝网的发展,在不久以后,钱已经解决不了我们的问题了。花钱买豪华的配置,也许能支持1亿PV的,但淘宝网的发展实在是太快了,到了10亿怎么办?到了百亿怎么办?在N年以后,我们不得不创造技术,解决这些只有世界顶尖的才会遇到的问题。后来我们在开源软件的基础上进行自主研发,一步一步的把IOE(IBM小型机、Oracle、EMC存储)这几个“神器”都去掉了。这就如同在《西游记》里面,妖怪们拿到神仙的兵器会非常厉害,连猴子都能够打败,但最牛的神仙是不用这些神器的,他们挥一挥衣袖、翻一下手掌就威力无比。去IOE这一部分会在最后一个章节里面讲,这里先埋个千里伏笔。

欲知后事如何,且听下回分解。

已经有读者在迫不及待的问怎么去掉了IOE,别急,在去掉IOE之前还有很长的路要走。行癫他们买回来小型机之后,我们用上了Oracle,七公带着一帮DBA在优化SQL和存储,行癫带着几个架构师在研究数据库的扩展性。Oracle本身是一个封闭的系统,用Oracle怎么做扩展?用现在一个时髦的说法就是做“分库分表”。

我们知道一台Oracle的处理能力是有上限的,它的连接池有数量限制,查询速度跟容量成反比。简单的说,在数据量上亿、查询量上亿的时候,就到它的极限了。要突破这种极限,最简单的方式就是多用几个Oracle数据库。但一个封闭的系统做扩展,不像分布式系统那样轻松。我们把用户的信息按照ID来放到两个数据库里面(DB1/DB2),把商品的信息跟着卖家放在两个对应的数据库里面,把商品类目等通用信息放在第三个库里面(DBcommon)。这么做的目的除了增加了数据库的容量之外,还有一个就是做容灾,万一一个数据库挂了,整个上还有一半的数据能操作。

数据库这么分了之后,应用程序有麻烦了,如果我是一个买家,买的商品有DB1的也有DB2的,要查看“我已买到的宝贝”的时候,应用程序怎么办?必须到两个数据库里面分别查询出来对应的商品。要按时间排序怎么办?两个库里面“我已买到的宝贝”全部查出来在应用程序里面做合并。还有分页怎么处理?关键字查询怎么处理?这些东西交给程序员来做的话会很悲催,于是行癫在淘宝的第一个架构上的作品就来解决了这个问题,他写了一个数据库路由的框架DBRoute,这个框架在淘宝的Oracle时代一直在使用。后来随着业务的发展,这种分库的第二个目的——容灾的效果就没有达到。像评价、投诉、举报、收藏、我的淘宝等很多地方,都必须同时连接DB1和DB2,哪个库挂了都会导致整个挂掉。

上一篇说过,采用EJB其实是和Sun的工程师妥协的结果,在他们走了之后,EJB也逐渐被冷落了下来。在05、06年的时候,spring大放异彩,正好利用spring的反射(IoC)模式替代了EJB的工厂模式,给整个系统精简了很多代码。

上一篇还说过,为了减少数据库的压力,提高搜索的效率,我们引入了搜索引擎。随着数据量的继续增长,到了2005年,商品数有1663万,PV有8931万,注册会员有1390万,这给数据和存储带来的压力依然山大,数据量大,性能就慢。亲,还有什么办法能提升系统的性能?一定还有招数可以用,这就是缓存和CDN(容分发网络)。

你可以想象,九千万的访问量,有多少是在商品详情页面?访问这个页面的时候,数据全都是只读的(全部从数据库里面读出来,不写入数据库),如果把这些读操作从数据库里面移到存里,数据库将会多么的感激涕零。在那个时候我们的架构师多隆大神,找到了一个基于Berkeley DB 的开源的缓存系统,把很多不太变动的只读信息放了进去。其实最初这个缓存系统还比较弱,我们并没有把整个商品详情都放在里面,一开始把卖家的信息放里面,然后把商品属性放里面,商品详情这个字段太大,放进去受不了。说到商品详情,这个字段比较恐怖,有人统计过,淘宝商品详情打印出来平均有5米长,在系统里面其实放在哪里都不招人待见。笔者清楚的记得,我来淘宝之后担任项目经理做的第一个项目就是把商品详情从商品表里面给移出来。这个字段太大了,查询商品信息的时候很多都不需要查看详情,它跟商品的价格、运费这些放在一个表里面,拖慢了整个表的查询速度。在05年的时候,我把商品详情放在数据库的另外一表里面,再往后这个大字段被从数据库里面请了出来,这也让数据库再一次感激涕零。

到现在为止,整个商品详情的页面都在缓存里面了,眼尖的读者可能会发现现在的商品详情不全是“只读”的信息了,这个页面上有个信息叫“浏览量”,这个数字每刷新一次页面就要“写入”数据库一次,这种高频度实时更新的数据能用缓存吗?如果不用缓存,一天几十亿的写入,数据库会怎么样?一定会挂掉。那怎么办?亲……

CDN这个工作相对比较独立,跟别的系统一样,一开始我们也是采用的商用系统。后来随着流量的增加,商用的系统已经撑不住了,LVS的创始人章文嵩博士带人搭建了淘宝自己的CDN网络。在本文的引言中

我说过淘宝的CDN系统支撑了800Gbps以上的流量,作为对比我们可以看一下国专业做CDN的上市公司ChinaCache的介绍——“ChinaCache……是中国第一的专业CDN服务提供商,向客户提供全方位网络容快速分布解决方案。作为首家获信产部许可的CDN服务提供商,目前ChinaCache在全国50多个大中城市拥有近300个节点,全网处理能力超过500Gbps,其CDN网络覆盖中国电信、中国网通、中国移动、中国联通、中国铁通和中国教育科研网等各大运营商。”——这样你可以看得出淘宝在CDN 上面的实力,这在全世界都是数一数二的。另外因为CDN需要大量的服务器,要消耗很多能源(消耗多少?在前两年我们算过一笔帐,淘宝上产生一个交易,消耗的电足以煮熟4个鸡蛋)。这两年章文嵩的团队又在研究低功耗的服务器,在绿色计算领域也做了很多开创性的工作。淘宝CDN的发展需要专门一个章节来讲,想先睹为快的可以看一下笔者对章文嵩的专访:

http://qing.weibo./1866752224/6f4460e033000jme.html

回想起刚用缓存那段时间,笔者还是个小菜鸟,有一个经典的错误常常犯,就是数据库的容更新的时候,忘记通知缓存系统,结果在测试的时候就发现我改过的数据怎么在页面上没变化呢。后来做了一些页面上的代码,修改CSS和JS的时候,用户本地缓存的信息没有更新,页面上也会乱掉,在论坛上被人说的时候,我告诉他用ctrl+F5刷新页面,然后赶紧修改脚本文件的名称,重新发布页面。学会用ctrl+F5的会员对我佩服的五体投地,我却惭愧的无地自容。

有些技术的发展是顺其自然的,有些却是突如其来的。到2007年的时候,我们已经有几百台应用服务器了,这上面的java应用服务器是weblogic,而weblogic是非常贵的,比这些服务器本身都贵。有一段时间多隆研究了一下jboss,说我们换掉weblogic吧,于是又省下了不少银两。那一年,老马举办了第一届的“网侠大会”,会上来的大侠中有一位是上文提到的章文嵩,还有一位曾经在jboss团队工作,我们也把这位大侠留下了,这样我们用起jboss更加有底气了。

这些杂七杂八的修改,我们对数据分库、放弃EJB、引入Spring、加入缓存、加入CDN、采用开源的Jboss,看起来没有章法可循,其实都是围绕着提高容量、提高性能、节约成本来做的,由于这些不算大的版本变迁,我们姑且叫它2.1版吧,这个版本从构图上来看有3只脚,是不是稳定了很多?

架构图如下:

下集预告:创造技术分布式文件系统TFS、分布式kv缓存tair、搜索引擎升级

淘宝技术框架分析报告

淘宝技术框架分析报告 淘宝作为国内首屈一指的大型电子商务网站,每天承载近30亿PV的点击量,拥有近50PB的海量数据,那么淘宝是如何确保其网站的高可用的呢?本文将对淘宝在构建大型网站过程中所使用到的技术框架做一个总结,并结合吉林银行现有技术框架进行对比分析。另外,本文还会针对金融互联网以及公司未来技术发展方向给出个人看法。 淘宝技术分析 CDN技术及多数据中心策略 国内的网络由于运营商不同(分为电信、联通、移动),造成不同运营商网络之间的互访存在性能问题。为了解决这个问题,淘宝在全国各地建立了上百个CDN节点,当用户访问淘宝网站时,浏览器首先会访问DNS服务器,通过DNS解析域名,根据用户的IP将访问分配到不同的入口。如果客户的IP属于电信运营商,那么就会被分配到同样是电信的CDN节点,并且保证访问的(这里主要指JS、CSS、图片等静态资源)CDN节点是离用户最近的。这样就将巨大的访问量分散到全国各地。另外,面对如此巨大的业务请求,任何一个单独的数据中心都是无法承受的,所以淘宝在全国各主要城市都建立了数据中心,这些数据中心不但保证了容灾,而且各个数据中心都在提供服

务。不管是CDN技术还是多个数据中心,都涉及到复杂的数据同步,淘宝很好的解决了这个问题。吉林银行现在正在筹建两地三中心,但主要目的是为了容灾,数据中心的利用率差,而淘宝的多个数据中心利用率为100%。 LVS技术 淘宝的负载均衡系统采用了LVS技术,该技术目前由淘宝的章文嵩博士负责。该技术可以提供良好的可伸缩性、可靠性以及可管理型。只是这种负载均衡系统的构建是在Linux操作系统上,其他操作系统不行,并且需要重新编译Linux操作系统内核,对系统内核的了解要求很高,是一种软负载均衡技术。而吉林银行则通过F5来实现负载均衡,这是一种硬负载均衡技术。 Session框架 Session对于Web应用是至关重要的,主要是用来保存用户的状态信息。但是在集群环境下需要解决Session共享的问题。目前解决这个问题通常有三种方式,第一个是通过负载均衡设备实现会话保持,第二个是采用Session复制,第三个则是采用集中式缓存。第二种方式严重制约了集群环境的可伸缩性,不利于集群的横向扩展,即使是采取两两复制也会造成集群内部网络负载严重,更别说采用广播的方式,会造成网络垃圾。淘宝采用了第三种方式,因为第一种方式对于淘宝来说成本比较高,而且他们已经采用了LVS的负载均衡技术。吉

淘宝的发展史

淘宝发展史-淘宝网发展史-淘宝网站案例分析(2) 挑战霸主悬念?收费、上市,一系列行动表明淘宝似乎在准备着下一阶段攻坚战的“粮草”。当 2004 年年初 eBay 易趣以 290 亿美元市值成为互联网企业领头羊的时候,几乎所有人都对 C2C 的发展抱以厚望。这之后,虽然 eBay 易趣 2004 年每股收益率与华尔街的预期相比略有差距,导致 eBay 易趣股价在一天内下跌了 19%。但事实上,eBay 易趣的每股收益只比证券分析师的预测低了 1 美分。且与 2003 年相比, eBay 易趣 2004 年的年收入增长了 51%,净收入增长了 76%。也就是说,并不是 eBay 易趣不够好,只是人们希望它更好而已。据统计,中国电子商务这几年的增长速度在 40%, 2005 年之后的几年里增长速度有可而能超过 50%。来自艾瑞市场咨询的最新报告显示,2004 年中国网上拍卖市场规模实现了 217.8%的增长,全年成交金额从 2003 年的 10.7 亿元增至 34 亿元,预计国内网上拍卖市场今后三年的市场年均增长率将实现 84%。虽然中国的 C2C 行业与 eBay 易趣盈利的状况还相距甚远,但高回报却一直在刺激着他们敏锐的神经。在 2003 年之前,这一市场上除了易趣,几乎没有什么其它的竞争对手。但是淘宝的出现还是一个巨大的变化。从最近淘宝的数据公布情况来看,亚洲第一、中国第一已经成为淘宝在电子商务网站中的战略目标。从历史发展的角度看,eBay 易趣比淘宝的资历要老得多。曾几何时,易趣几乎就是中国 C2C 的代名词,这使人们不得不相信,易趣从时间的积淀中得到的东西远非资本可以换得。而淘宝作为一个激进的后来者,能够超过易趣可能还是本土化因素在起作用。与阿里巴巴“墙内开花墙外香”的成名历程不同,淘宝网在国内的人气飚升极快。从互联网实验室电子商务网站 CISI 人气榜的变化看,2004 年前,还没有淘宝的位置,但从 2004 年 2 月开始,淘宝以每月 768.00%的速度上升到仅次于 eBuy 易趣的第二位;在推出 1 年后,淘宝排名已经超过 eBuy 易趣位居第一。淘宝的出现更是让易趣被塑造成了“店大欺客”的形象,弊病、漏洞、不足、傲慢都被一一捅出,使之疲于修正补救。因此,除了免费之外,淘宝也因为强势参与竞争,改善了国内 C2C 市场环境而得到了众多人的肯定,犹如电信领域的中联通对恃中移动之现状。对于淘宝的后发优势,易趣显然并不是没有察觉到。其公关经理唐磊这样表示:在国内的电子商务市场上,有很多企业后发,而且都发展得很快。我觉得这是一个好事情。这分两方面来谈,第一,模仿是最好的赞美。大家都来做这个模式,说明大家对这个模式是认可的。第二,大家都有发展,说明这个行业的潜在市场很大。说明这个市场是真得值得我们去投入,去花心思做好、做强、做大的。如果没发展到这一步,就说明市场不行。近日,微软在中国推出 MSN 门户及其他互联网产品及服务。在微软选定的 8 家合作伙伴中,淘宝击败了微软全球合作伙伴 Ebay 成为购物频道的合作伙伴。马云表示“这说明微软认为我会赢。”正如 eBay 易趣从 5 月 1 日开始的两年多来第一次大规模降价。与之相反,在此之前 Ebay 试图提高其在美国和欧洲的收费标准。5 月 7 日,在华源科技高峰论坛上,原易趣 CEO 邵亦波谈到中国个人网上交易市场的局面时流露心声,“中国电子商务潜力巨大,但中国市场竞争非常激烈,到目前讨论谁是最后的赢家还为时过早。” 马云:巧借娱乐打天下马云是一个作秀的高手。最经典的就是每年一期的“西湖论剑”。不仅按照金庸武侠小说写到的邀请到各路“武林高手”捧场,更是把金庸本人也请到了杭州。但马云的出名还不是“西湖 论剑”,而是他是最早发现互联网和娱乐结合是必然趋势并付诸实践的人之一,马云的生意多和娱乐有关。《手机》里的摩托罗拉手机、《天地英雄》中姜文的宝刀、《铁齿铜牙纪晓岚》中纪晓岚的烟袋锅、《刘罗锅》中的轿子、《少年天子》中的龙袍、《空镜子》中的梳妆台等道具,这些东西你想要吗?知道这些东西向谁要吗?答案是马云可以帮你找到这一切。 2004 年 7 月,刚刚获得母公司阿里巴巴 3.5 亿元注资的淘宝再度祭起娱乐营销利器,参与了张元执导、王朔首次担任监制的电影《看上去很美》的开机仪式,并成为该片独家指定道具拍卖网站。此后,尝到甜头的淘宝一发而不可收,于今年 4 月再次与冯小刚贺岁大

淘宝网的发展史

淘宝网的发展史,阿里巴巴的发展史 核心提示:阿里巴巴的发展史 阿里巴巴1999年3月开始创建。投资50万,1999年7月在香港成立阿里巴巴中国控股有限公司,既总公司,9月在杭州成立阿里巴巴(中国)网络技术有限公司,既中国区 总部,这时会员有2万;10月引入500万 阿里巴巴的发展史 阿里巴巴1999年3月开始创建。投资50万,1999年7月在香港成立阿里巴巴中国控股有限公司,既总公司,9月在杭州成立阿里巴巴(中国)网络技术有限公司,既中国区总部,这时会员有2万;10月引入500万美元风险投资资金;1999年年底会员8.9万;2000年1月日本互连网投资公司入股2000万美元;200年会员达到50万;2001年6月韩文站在韩国汉城正式开通;2001年12月当月开始赢利,注册商人会员100万,成为全球首家会员超过百万的商务网;2002年2月日本亚洲投资公司投资;2002年3月与商人会员创建诚信的网上商务社区;2002年10月日文网站正式开通;2002年底赢利,冲破现金赢利600万元;2 003年5月提前实现当月每日100万元人民币;2003年7月7日宣布投资1亿元建设淘宝网站阿里巴巴只做信息流,不做资金流和物流业务。 由阿里巴巴大事记可以看出以下几点: 1999年,阿里在创业初期,创建人马云努力宣传自己的电子商务理论,在国内国外引起了很大的反响,由此,他的理论也在他的公司最困难的时候得到了风险公司的认可,先后的到了两次风险投资; 2000年到2001年阿里巴巴进行了各种应用系统的开发,同时也在继续再探讨和升华经营理论;2002年提出了赢利目标,开发国内的市场,开始尝试与展览会向结合;2003年继续扩大市场,加速与展览会的结合,同时开始大力的与各种媒体合作,给用户提供超值服务。这几年间阿里一直不断的探索如何发展电子商务,参加各种世界范围的论坛,与用户不断接触,了解用户的需求,从而为用户提供越赖越受用户欢迎的服务。阿里在发展过程中,开发服务功能时是与相关公司一起开发,这样在信息的广度和准确性都得以保证;它与国内外的大型企业合作,同时开发中小企业市场,他通过自己的知名度,利用培训的方式占领市场。总之阿里一切服务都是从他的用户需求出发。

淘宝技术架构发展总结

从个人网站到淘宝网仰观Java时代淘宝的技术发展(1)引言 光棍节的狂欢 “时间到,开抢!”坐在电脑前早已等待多时的小美一看时间已到2011年11月11日零时,便迫不及待地投身于淘宝商城一年一度的大型网购促销活动——“淘宝双11购物狂欢节”。小美打开早已收藏好的宝贝——某品牌的雪地靴,飞快的点击购买,付款,一回头发现3000双靴子已被抢购一空。 小美跳起来,大叫一声“欧耶!” 小美不知道,就在11日零点过后的这一分钟内,全国有342万人和她一起涌入淘宝商城。当然,她更不知道,此时此刻,在淘宝杭州的一间办公室里,灯火通明,这里是“战时指挥部”,淘宝技术部的一群工程师,正在紧盯着网站的流量和交易数据。白板上是他们刚刚下的注,赌谁能最准确地猜中流量峰值和全天的交易总额。他们的手边放着充足的食物和各类提神的饮料。 一阵急促的电话声响起来,是前线部门询问数据的,工程师大声报着:“第1分钟,进入淘宝商城的会员有342万”。过一会工程师主动拿起电话:“交易额超过1亿了,现在是第8分钟。”接下来,“第21分钟,刚突破2亿”。“第32分钟,3亿了”。“第1个小时,亿”。这些数据随后出现在微博上,引起一片惊呼。 “完蛋了!”突然有人大喝一声,所有的眼睛都紧张的盯着他,只见他挠挠头,嘿嘿的笑道“我赌的少了,20亿轻松就能过了,我再加5亿”,他跑去白板边上把自己的赌注擦去,写上25,接下来有人写上28,有人写上30,有人跑到微博上开下盘口,同事们纷纷转载下注。接下来的这24个小时,战时指挥部的工程师们都不能休息,他们盯着网站的各种监控指标,适时的调整机器和增减功能。顶住第一波高峰之后,这些人开始忙里偷闲的给自己买东西,大家互相交流着哪家买的移动硬盘靠谱,哪家衣服适合自己的女朋友,不时的有人哀嚎宝贝被人抢了、信用卡额度不够了。同时,旁边白板上的赌注越下越大。 11月11日,这个棍子最多的日子被网民自我调侃的变成了一个节日——“光棍节”。而淘宝网又用疯狂的折扣促销给它赋予了另外一个意义——“购物狂欢节”。2011年11月11日这一天,淘宝商城与淘宝网交易额之和突破52亿,这个数字是“购物天堂”香港一天零售总额亿的6倍。

淘宝发展历程概述

淘宝发展历程概述 从2003年成立,淘宝搭建了电子商务生态圈。阿里巴巴是中国较大的网络广告交易平台,2008年9月与淘宝合并。在中国,有超过一百万的中小网站创造着超过80%的互联网流量,阿里巴巴帮助这些中小网站销售和变现他们的网络广告资源。 2004年前,互联网实验室电子商务网站CISI人气榜上,还没有淘宝网的位置;但从2004年2月开始,淘宝网以每月768.00%的速度上升到仅次于eBay易趣的第二位;在推出1年后,淘宝网排名已经超过eBay易趣,位居第一。来自艾瑞市场咨询的报告显示,2004年中国网上拍卖市场规模实现了217.8%的增长,全年成交金额从2003年的10.7亿元增至2004年的34亿元。 2005年的8月,淘宝网的发展脉络再度跟中国的宏观经济走向产生了微妙的重合,从这一年开始,淘宝网开始把它的竞争对手们抛在身后,它的每一个产品的推出都足以令业界瞠目,而它的执行能力和市场拓展能力使得它的每一个商业故事都变得可行而且耀眼。 2006年,淘宝网成为亚洲最大购物网站,就在这一年,淘宝网第一次在中国实现了一个可能——互联网不仅仅是作为一个应用工具存在,它将最终构成生活的基本要素,调查数据显示,每天有近900万人上淘宝网"逛街"。

2007年,淘宝网不再是一家简单的拍卖网站,而是亚洲最大的网络零售商圈。这一年,淘宝网全年成交额突破400亿,成中国第二大综合卖场。 2008年,淘宝B2C新平台淘宝商城(天猫前身)上线;汶川地震捐款平台上线,共筹得网友捐款超2000万;9月份,淘宝网单月交易额突破百亿大关。 2009年,已成为中国最大的综合卖场,全年交易额达到2083亿元。 2010年1月1日淘宝网发布全新首页,此后聚划算 (https://www.doczj.com/doc/b87326847.html,)上线,然后又推出一淘网。 2011年6月16日,阿里巴巴集团旗下淘宝公司分拆为三个独立的公司,即沿袭原C2C业务的淘宝网(taobao),平台型B2C电子商务服务商淘宝商城(tmall)和一站式购物搜索引擎一淘网(etao)。在新的架构中,淘宝分拆后的三家公司采用总裁加董事长的机制运营。 2012年1月11日上午,淘宝商城正式宣布更名为“天猫”。2012年3月29日天猫发布全新Logo形象。2012年11月11日,天猫借光棍节大赚一笔,宣称13小时卖100亿,创世界纪录。

淘宝技术架构发展总结

引言 光棍节的狂欢 “时间到,开抢!”坐在电脑前早已等待多时的小美一看时间已到2011年11月11日零时,便迫不及待地投身于淘宝商城一年一度的大型网购促销活动——“淘宝双11购物狂欢节”。小美打开早已收藏好的宝贝——某品牌的雪地靴,飞快的点击购买,付款,一回头发现3000双靴子已被抢购一空。 小美跳起来,大叫一声“欧耶!” 小美不知道,就在11日零点过后的这一分钟内,全国有342万人和她一起涌入淘宝商城。当然,她更不知道,此时此刻,在淘宝杭州的一间办公室里,灯火通明,这里是“战时指挥部”,淘宝技术部的一群工程师,正在紧盯着网站的流量和交易数据。白板上是他们刚刚下的注,赌谁能最准确地猜中流量峰值和全天的交易总额。他们的手边放着充足的食物和各类提神的饮料。 一阵急促的电话声响起来,是前线部门询问数据的,工程师大声报着:“第1分钟,进入淘宝商城的会员有342万”。过一会工程师主动拿起电话:“交易额超过1亿了,现在是第8分钟。”接下来,“第21分钟,刚突破2亿”。“第32分钟,3亿了”。“第1个小时,亿”。这些数据随后出现在微博上,引起一片惊呼。 “完蛋了!”突然有人大喝一声,所有的眼睛都紧张的盯着他,只见他挠挠头,嘿嘿的笑道“我赌的少了,20亿轻松就能过了,我再加5亿”,他跑去白板边上把自己的赌注擦去,写上25,接下来有人写上28,有人写上30,有人跑到微博上开下盘口,同事们纷纷转载下注。接下来的这24个小时,战时指挥部的工程师们都不能休息,他们盯着网站的各种监控指标,适时的调整机器和增减功能。顶住第一波高峰之后,这些人开始忙里偷闲的给自己买东西,大家互相交流着哪家买的移动硬盘靠谱,哪家衣服适合自己的女朋友,不时的有人哀嚎宝贝被人抢了、信用卡额度不够了。同时,旁边白板上的赌注越下越大。 11月11日,这个棍子最多的日子被网民自我调侃的变成了一个节日——“光棍节”。而淘宝网又用疯狂的折扣促销给它赋予了另外一个意义——“购物狂欢节”。2011年11月11日这一天,淘宝商城与淘宝网交易额之和突破52亿,这个数字是“购物天堂”香港一天零售总额亿的6倍。 网民感受到的是疯抢的喜悦,而网站的技术人员感受到的却是“压力山大”。就如同你家办酒席,宴请左邻右舍,这个办起来容易。倘若宴请十里八乡所有的人,吃饭的人自然开心,但却不是一般人家能够办得起来的。能办得起来如此盛宴者,需要强大的财力物力、组织能力、技术实力(例如做这么多菜,你的炒

淘宝网背景介绍

20个名词记录中国电子商务15年 用一个个名词来记录某个行业的发展历程可能失于简单,可是,却很有意思,比如说,你还记得那个叫做“72小时网络生存”的活动吗? 这个活动在1999年进行,当时活动参与者需要在封闭的房间里生存三天,维持生命的食物和水必须通过房间里能够上网的电脑购买。这是很多人对于什么叫网购的第一印象。 在2000年,老牌电子商务网站易趣、当当网和卓越网已经成立,卓越上的正版DVD 销售势头很猛,第一张卖火了的DVD碟就是《大话西游》。不过,那时候,行业里也有不少泡沫存在,比如说,一家叫做e国的网站曾经推出过“满10元送听装可乐”的营销方式,送货还免费,真的不知道这家网站最后亏了多少。 在互联网资本泡沫的鼓励之下,中国的网民完成了对网络购物的初期认识。此后,电子商务进入普及阶段。 2003年,eBay收购易趣网进入中国,不过,它很快遭遇到一个中国本土的对手,成立于2003年的淘宝网。淘宝用了3年时间打败eBay,在此期间,随着网上购物在普通人群中的普及,很多特有名词应运而生,包括买家、卖家、网商、淘、钻、刷钻、皇冠、炒信、包邮、支付宝…… 后来,一个更加流行的词汇也出现了——“亲”。 这个词汇出现于淘宝网,卖家之间、买卖双方之间都常常采用,用以指代“亲爱的”。“亲”的出现是电子商务普及时期的一个象征,但它也更是电子商务行业升级换代的一种表示,它代表着商家对于客服工作的习惯性用心和关注。 进入到2009年,商户们对货品质量、客服、物流更加上心,也是在同一时期,资本大量进入电子商务B2C(商户对个人)行业,电子商务网站也开始追求品牌效应。 2010年10月,凡客体流行;12月,当当网赴美上市;2011年4月,京东商城宣布C 轮融资15亿美元,几家B2C网站拼完价格就拼送货;而到了今年夏天,几家新兴的鞋类电商网站,更是打起大品牌、潮品牌的主意,电子商务已经不纯粹是“货品齐、价格低”的概念了。

马云的淘宝网结构介绍

马云淘宝网结构介绍 背景:阿里巴巴宣布注资1亿元创办淘宝网的时候,互联网冬天的阴影还很沉重,淘宝网 的投资实际上是整个冬天之后互联网业界的第一次大规模投资。与此同时,易趣已经占领了中国80%以上的市场份额,而eBay已在2002年以3000万美元的代价,收购了易趣三分之一的股份,并在2003年以1.5亿美元的价格收购了易趣余下的股份,并允诺继续增加对中国市场的投入,以增强其在中国市场的绝对领先地位。阿里巴巴的CEO马云在这样的时刻选择进入C2C领域被当时的一些媒体形容为“非理智”、“疯狂”和“豪赌”。 马云当时的做法让很多人难以理解,但是对于阿里巴巴自己人讲,却习以为常,马云经常讲,“在大家都觉得是一个机会的时候,我们不会去凑热闹。而越在大家都还没有开始准备,甚至避之不及的时候,往往正是最大的机会所在。” 投资淘宝的想法诞生在2003年年初,是时马云认为个人电子商务市场开始逐渐成熟,而且阿里巴巴的业务已经相对稳固,需要做更长远的打算。“eBay易趣当时在中国的确做得很大,但我们发现它有很多弱点。客户对它的抱怨很多,这就是我们的机会。”孙彤宇当时正是淘宝网项目的负责人。他所说的弱点,其中的重要一点是eBay易趣坚持的收费原则。“在那个时候就采取收费模式,我们觉得在时间上并不适合。所以我们在去年一直呼吁大家以培育市场为目的,不要急着去收钱。”孙彤宇说。 在瞄准对手弱点之后,短短的120天之后,孙彤宇就完成了从详细的市场调研到组建10人团队的“创业”过程。在前期没有进行任何市场推广的情况下,2003年5月10日,淘宝网正式上线。20天后,淘宝网迎来第1万名注册用户。2003年7月7 日,阿里巴巴正式宣布投资1亿元开办淘宝网。 组织结构:2010年淘宝的交易额高达4000亿元人民币,这是一个让人惊叹的数字。网 购的巨大市场无疑会吸引更多的人在淘宝开店。然而今天要在淘宝成功闯出一片天地,难度却比以往大得多。自从淘宝商城出现后,大大小小的个人卖家除了相互之间的激烈竞争,还要面对无论资金、人力、物力,还是可信度都比个人店强得多的品牌店的竞争,生存的空间势必越来越小。可以说,一个人撑起一个皇冠店的时代已经成了过去式。要在当今激烈的电子商务竞争中生存下来并且盈利,必须依靠团队的力量。那么,运营一家成功的淘宝网店,需要一个什么样的团队呢? 我们认为,一个高效的淘宝网店团队应该至少配备以下人员:一个营运经理,负责整个店铺的统筹和营运管理;一个策划人员,负责产品的文案描述,网店的推广以及各种促销活动的策划;一个美工,负责店铺的视觉美化;一个财务人员,负责财务管理;此外,还需要配备与销售规模相应的客服人员与物流人员,负责销售与售后配送的工作。 人力资源管理:(一)运营经理1、负责网店整体规划、营销、推广、客户关系管理 等系统经营性工作;2、负责网店日常改版策划、上架、推广、销售、售后服务等经营与管理工作;3、负责网店日常维护,保证网店的正常运作,优化店铺及商品排名;4、负责执行与配合公司相关营销活动,策划店铺促销活动方案;5、负责收集市场和行业信息,提供有效应对方案;6、制定销售计划,带领团队完成销售业绩目标;7、客户关系维护,处理相关客户投诉及纠纷问题。 (二)客服人员1、通过在线聊天工具,负责在淘宝上和顾客沟通,解答顾客对产品和购

案例淘宝技术发展史精编

案例淘宝技术发展史精 编 Document number:WTT-LKK-GBB-08921-EIGG-22986

目录 一、 二、 三、 四、 五、 六、 七、 作者:赵超 一、引言 光棍节的狂欢 “时间到,开抢!”坐在电脑前早已等待多时的小美一看时间已到 2011 年 11 月 11 日零时,便迫不及待地投身于淘宝商城一年一度的大型网购促销活动——“淘宝双11购物狂欢节”。小美打开早已收藏好的宝贝——某品牌的雪地靴,飞快的点击购买,付款,一回头发现3000 双靴子已被抢购一空。 小美跳起来,大叫一声“欧耶!”

小美不知道,就在 11 日零点过后的这一分钟内,全国有 342 万人和她一起涌入淘宝商城。当然,她更不知道,此时此刻,在淘宝杭州的一间办公室里,灯火通明,这里是“战时指挥部”,淘宝技术部的一群工程师,正在紧盯着网站的流量和交易数据。白板上是他们刚刚下的注,赌谁能最准确地猜中流量峰值和全天的交易总额。他们的手边放着充足的食物和各类提神的饮料。 一阵急促的电话声响起来,是前线部门询问数据的,工程师大声报着:“第 1 分钟,进入淘宝商城的会员有342 万”。过一会工程师主动拿起电话:“交易额超过 1 亿了,现在是第 8 分钟。”接下来,“第 21 分钟,刚突破 2 亿”。“第 32 分钟,3 亿了”。“第 1 个小时,亿”。这些数据随后出现在微博上,引起一片惊呼。 “完蛋了!”突然有人大喝一声,所有的眼睛都紧张的盯着他,只见他挠挠头,嘿嘿的笑道“我赌的少了,20 亿轻松就能过了,我再加 5 亿”,他跑去白板边上把自己的赌注擦去,写上 25,接下来有人写上 28,有人写上30,有人跑到微博上开下盘口,同事们纷纷转载下注。接下来的这 24 个小时,战时指挥部的工程师们都不能休息,他们盯着网站的各种监控指标,适时的调整机器和增减功能。顶住第一波高峰之后,这些人开始忙里偷闲的给自己买东西,大家互相交流着哪家买的移动硬盘靠谱,哪

阿里巴巴的发展史

阿里巴巴的发展史:阿里巴巴1999年3月开始创建。投资50万,1999 年7月在香港成立阿里巴巴中国控股有限公司,既总公司,9月在杭州成立阿里巴巴(中国)网络技术有限公司,既中国区总部,这时会员有2万;10月引入500万美元风险投资资金;1999年年底会员8.9万;2000年1月日本互连网投资公司入股2000万美元;200年会员达到50万;2001年6月韩文站在韩国汉城正式开通;2001年12月当月开始赢利,注册商人会员100万,成为全球首家会员超过百万的商务网;2002年2月日本亚洲投资公司投资;2002年3月与商人会员创建诚信的网上商务社区;2002年10月日文网站正式开通;2002年底赢利,冲破现金赢利600万元;2003年5月提前实现当月每日100万元人民币;2003年7月7日宣布投资1亿元建设淘宝网站阿里巴巴只做信息流,不做资金流和物流业务。 由阿里巴巴大事记可以看出以下几点:1999年,阿里在创业初 期,创建人马云努力宣传自己的电子商务理论,在国内国外引起了很大的反响,由此,他的理论也在他的公司最困难的时候得到了风险公司的认可,先后的到了两次风险投资; 2000年到2001年阿里巴巴进行了各种应用系统的开发,同时也在继续再探讨和升华经营理论;2002年提出了赢利目标,开发国内的市场,开始尝试与展览会向结合;2003年继续扩大市场,加速与展览会的结合,同时开始大力的与各种媒体合作,给用户提供超值服务。这几年间阿里一直不断的探索如何发展电子商务,参加各种世界范围的论坛,与用户不断接触,了解用户的需求,从而为用户提供越赖越受用户欢迎的服务。阿里在发展过程中,开发服务功能时是与相关公司一起开发,这样在信息的广度和准确性都得以保证;它与国内外的大型企业合作,同时开发中小企业市场,他通过自己的知名度,利用培训的方式占领市场。总之阿里一切服务都是从他的用户需求出发。 淘宝发展史-淘宝网发展史-淘宝网站案例分析(2) 挑战霸主悬念?收费、上市,一系列行动表明淘宝似乎在准备着下一阶段攻坚战的“粮草”。当2004年年初eBay易趣以290亿美元市值成为互联网企业领头羊的时候,几乎所有人都对C2C的发展抱以厚望。这之后,虽然eBay易趣2004年每股收益率与华尔街的预期相比略有差距,导致eBay易趣股价在一天内下跌了19%。但事实上,eBay易趣的每股收益只比证券分析师的预测低了1美分。且与2003年相比,eBay易趣2004年的年收入增长了51%,净收入增长了76%。也就是说,并不是eBay易趣不够好,只是人们希望它更好而已。 据统计,中国电子商务这几年的增长速度在40%,而2005年之后的几年里增长速度有可能超过50%。来自艾瑞市场咨询的最新报告显示,2004年中国网上拍卖市场规模实现了217.8%的增长,全年成交金额从2003年的10.7亿元增至34亿元,预计国内网上拍卖市场今后三年的市场年均增长率将实现84%。 虽然中国的C2C行业与eBay易趣盈利的状况还相距甚远,但高回报却一直在刺激着他们敏锐的神经。在2003年之前,这一市场上除了易趣,几乎没有什么其它的竞争对手。但是淘宝的出现还是一个巨大的变化。从最近淘宝的数据公布情况来看,亚洲第一、中国第一已经成为淘宝在电子商务网站中的战略目标。

阿里巴巴发展历程

发展历程 1999年9月,马云带领下的18位创始人在杭州的公寓中正式成立了阿里巴巴集团 2000年1月,阿里巴巴集团从软银等数家投资机构融资2,000万美元。 2004年2月,阿里巴巴集团从数家一线投资机构融资8200万美元,成为当时中国互联网届最大规模的私募融资。 2005年10月,阿里巴巴集团于中国雅虎签订合作协议,收购并接管中国雅虎。 2012年9月,阿里巴巴集团完成对雅虎初步的股份回购并重组与雅虎的关系。 经营特色 1、构建多样化的跨境电商平台 2、搭建四通八达的跨境物流网络 3、阿里巴巴双十一品牌大于销售 4、阿里巴巴集货模式的优势 5、阿里巴巴清关模式的优势 6、阿里巴巴开展跨境业务中面临的挑战 效益分析 资金来源 1、会员费 2、广告费

3、竞价排名 4、增值服务 5、线下服务 6、商务合作 7、按询盘付费 经营方式分析 1、义乌模式,义乌模式的总体特点是:既买全国也买本地, 既卖全国,也卖全球。劳动密集型的小商品生产与大市场的结合,是义乌市场发展的基点。 2、阿里巴巴模式,作为全球最大的网上贸易市场,阿里巴巴 是当之无愧的电子商务的代表。阿里巴巴模式的总体特点是:网上交易,网下配送。 前景展望 在整个社会开始步入信息化时代的今天,企业上网已经成为不可阻挡的趋势,每个企业都想摸索出一条适合自己发展的电子商务之路。义乌在其原有的商业模式基础上结合了阿里巴巴模式,开创了其小商品市场全新的电子商务时代。 阿里巴巴SWOT 优势S 1、市场占有率及品牌价值高 2、资金安全性相对强且资金雄厚 3、营销能力和亲和力强

4、创新能力强 劣势W 1、信誉度降低 2、缺乏客户分级管理制度 3、利润增长率有所下降 4、搜索服务能力欠佳 5、没有物流是短板 6、销售团队过于庞大 机会O 1、国家产业政策支持发展 2、市场潜力巨大 3、新的电子商务模式不断出现 4、国家允许符合条件的第三方支付结算 5、人民币跨境结算 威胁T 1、电子商务领域竞争激烈 2、操作系统及CPU等核心技术受制于人 3、本币升值可能导致出口下降 详细发展历程 1999年9月,马云带领下的18位创始人在杭州的公寓中正式成立了阿里巴巴集团,集团的首个网站是英文全球批发贸易市场阿里巴巴。同年阿里巴巴集团推出专注于国内批发贸易的中国交

淘宝服务端技术架构详解

淘宝服务端技术架构详解

目录 一、前言 (3) 二、单机架构 (4) 三、多机部署 (4) 四、分布式缓存 (5) 五、Session 共享解决方案 (7) 六、数据库读写分离 (9) 七、CDN 加速与反向代理 (10) 八、分布式文件服务器 (11) 九、数据库分库分表 (11) 十、搜索引擎与NoSQL (13) 十一、后序 (13)

一、前言 以淘宝网为例,简单了解一下大型电商的服务端架构是怎样的。如图所示 最上面的就是安全体系系统,中间的就是业务运营系统,包含各个不同的业务服务,下面是一些共享服务,然后还有一些中间件,其中ECS 就是云服务器,MQS 是队列服务,OCS 是缓存等等,右侧是一些支撑体系服务。除图中所示之外还包含一些我们看不到的,比如高可用的体现。淘宝目前已经实现多机房容灾和异地机房单元化部署,为淘宝的业务也提供了稳定、高效和易于维护的基础架构支撑。这是一个含金量非常高的架构,也是一个非常复杂而庞大的架构,当然这个架构不是一天两天演进成这样的,也不是一开始就设计并开发成这样的,对于初创公司而言,很难在初期就预估到未来流量千倍、万倍的网站架构会是怎样的状况,同时如果初期就设计成千万级并发的流量架构,也很难去支撑这个成本。因此一个大型服务系统,都是从小一步一步走过来的,在每个阶段找到对应该阶段网站架构所面临的问题,然后不断解决这些问题,在这个过程中,整个架构会一直演进,同时内含的代码也就会演进,大到架构、小到代码都是在不断演进和优化的。所以说高大上的项目技术架构和开发设计实现不是一蹴而就的,这是所谓的万丈高楼平地起。

二、单机架构 从一个小网站说起,一般来说初始一台服务器就够了,文件服务器、数据库以及应用都部署在一台机器上。也就是俗称的 allinone 架构。这篇推荐看下:厉害了,淘宝千万并发,14 次架构演进… 三、多机部署 随着网站用户逐渐增多,访问量越来越大,硬盘、cpu、内存等开始吃紧,一台服务器难以支撑。看一下演进过程,我们将数据服务和应用服务进行分离,给应用服务器配置更好的cpu、内存等等,而给数据服务器配置更好、更快的大的硬盘,如图所示用了三台服务器进行部署,能提高一定的性能和可用性。

淘宝数据魔方技术架构解析

淘宝数据魔方技术架构解析 淘宝网拥有国内最具商业价值的海量数据。截至当前,每天有超过30亿的店铺、商品浏览记录,10亿在线商品数,上千万的成交、收藏和评价数据。如何从这些数据中挖掘出真正的商业价值,进而帮助淘宝、商家进行企业的数据化运营,帮助消费者进行理性的购物决策,是淘宝数据平台与产品部的使命。 为此,我们进行了一系列数据产品的研发,比如为大家所熟知的量子统计、数据魔方和淘宝指数等。尽管从业务层面来讲,数据产品的研发难度并不高;但在“海量”的限定下,数据产品的计算、存储和检索难度陡然上升。本文将以数据魔方为例,向大家介绍淘宝在海量数据产品技术架构方面的探索。 淘宝海量数据产品技术架构 数据产品的一个最大特点是数据的非实时写入,正因为如此,我们可以认为,在一定的时间段内,整个系统的数据是只读的。这为我们设计缓存奠定了非常重要的基础。 图1 淘宝海量数据产品技术架构 按照数据的流向来划分,我们把淘宝数据产品的技术架构分为五层(如图1所示),分别是数据源、计算层、存储层、查询层和产品层。位于架构顶端的是我们

的数据来源层,这里有淘宝主站的用户、店铺、商品和交易等数据库,还有用户的浏览、搜索等行为日志等。这一系列的数据是数据产品最原始的生命力所在。 在数据源层实时产生的数据,通过淘宝主研发的数据传输组件DataX、DbSync 和Timetunnel准实时地传输到一个有1500个节点的Hadoop集群上,这个集群我们称之为“云梯”,是计算层的主要组成部分。在“云梯”上,我们每天有大约40000个作业对1.5PB的原始数据按照产品需求进行不同的MapReduce计算。这一计算过程通常都能在凌晨两点之前完成。相对于前端产品看到的数据,这里的计算结果很可能是一个处于中间状态的结果,这往往是在数据冗余与前端计算之间做了适当平衡的结果。 不得不提的是,一些对实效性要求很高的数据,例如针对搜索词的统计数据,我们希望能尽快推送到数据产品前端。这种需求再采用“云梯”来计算效率将是比较低的,为此我们做了流式数据的实时计算平台,称之为“银河”。“银河”也是一个分布式系统,它接收来自TimeTunnel的实时消息,在内存中做实时计算,并把计算结果在尽可能短的时间内刷新到NoSQL存储设备中,供前端产品调用。 容易理解,“云梯”或者“银河”并不适合直接向产品提供实时的数据查询服务。这是因为,对于“云梯”来说,它的定位只是做离线计算的,无法支持较高的性能和并发需求;而对于“银河”而言,尽管所有的代码都掌握在我们手中,但要完整地将数据接收、实时计算、存储和查询等功能集成在一个分布式系统中,避免不了分层,最终仍然落到了目前的架构上。 为此,我们针对前端产品设计了专门的存储层。在这一层,我们有基于MySQL 的分布式关系型数据库集群MyFOX和基于HBase的NoSQL存储集群Prom,在后面的文字中,我将重点介绍这两个集群的实现原理。除此之外,其他第三方的模块也被我们纳入存储层的范畴。

淘宝天猫搜索的发展历程

淘宝天猫搜索的发展历程 淘宝和天猫均脱胎于“大淘宝”,两者有这么密不可分的关系。另外,当用户进行淘宝搜索时,会随之带动天猫搜索。那么,淘宝搜索自产生以来,随着市场需求的变化而更新调整,它大致包括哪些发展阶段呢?总得来说,有以下三个发展阶段: 第一阶段,是指在2010年以前,主要是以宝贝上下架时间和店铺宝贝橱窗推荐作为排序的重要依据。在那时,上架之哟啊将店铺宝贝上下架时间进行合理安排,再把店铺主推的宝贝设置微橱窗推荐即可,排名参考的权重因素较少也相对简单。在该阶段,淘宝搜索主要以平均分配流量为目的。 第二阶段,是指2010-2012年,淘宝做了重大调整,开始引入服务模型,在搜索时重点推荐哪些服务好、评价高、质量优的商品。此次调整影响颇大,很多服务欠佳、产品质量较差的商家店铺流量骤减,销量也收到较大影响。该阶段主要是在第一阶段的基础上,淘宝搜索开始优先推荐质量好、服务好的商品和店铺。 第三阶段,是指2012年一以后,淘宝引入个性化搜索,主要是根据买家的浏览习惯、购物习惯、消费能力进行精准定向。举例来说,一个经常购买低价商品的消费者,与另一个经常购买高价商品的消费者,即便搜索同一关键词,搜索

结果也会不同,从而帮助消费者更加精准地寻找产品,改善用户的个性化搜索体验。该阶段则是淘宝搜索在前两个阶段的基础上,根据买家的购买习惯,消费水平等因素,开始推荐知名度高、有特色的的商品。 天猫是“大淘宝”的一个重要分支,也是阿里巴巴着力打造的一个高端电商门户,整个淘宝系统也赋予了天猫较多的流量入口。天猫入驻的要求比淘宝C店高得多,但仍有许多上架希望入驻天猫,并希望在天猫上获得足够的流量。 天猫搜索是在淘宝搜索基础上发展而来的,但又在某些方面不同于淘宝搜索,这主要表现在:天猫搜索注重品牌化和精品化。这是天猫的特色,此外,商家在入驻天猫时需要有资深品牌,可见,天猫着重打造的是品牌,为此,天猫搜索给予品牌更多的权重和资源。其实,品牌化背后的意义,是天猫不希望上架纯粹以低价做诱惑在天猫销售,更希望上架销售高品质的商品,从而提升天猫平台的品质。 对品牌化而言,如果上架做的是小类目,难以在较大范围里做品牌知名度,天猫会希望上架做精品化。这里的精品是指被小众人群高度接受,或者说高度个性化的人群接受,也就是说,天猫希望上架成为一个类目的专家,只有高度专业的服务才能满足小部分人群的高难度要求。为此,商家针对的客户群体越确切,天猫则会给你更多的展示机会和资源位推荐,以及官方活动的参与机会。

淘宝网技术架构

淘宝网的开源架构 淘宝网,是一个在线商品数量突破一亿,日均成交额超过两亿元人民币,注册用户接近八千万的大型电子商务网站,是亚洲最大的购物网站。那么对于淘宝网这样大规模的一个网站,我猜想大家一定会非常关心整个网站都采用了什么样的技术、产品和架构,也会很想了解在淘宝网中是否采用了开源的软件或者是完全采用的商业软件。那么下面我就简单的介绍一下淘宝网中应用的开源软件。 对于规模稍大的网站来说,其IT必然是一个服务器集群来提供网站服务,数据库也必然要和应用服务分开,有单独的数据库服务器。对于像淘宝网这样规模的网站而言,就是应用也分成很多组。那么下面,我就从应用服务器操作系统、应用服务器软件、Web Server、数据库、开发框架等几个方面来介绍一下淘宝网中开源软件的应用。 操作系统 我们首先就从应用服务器的操作系统说起。一个应用服务器,从软件的角度来说他的最底层首先是操作系统。要先选择操作系统,然后才是操作系统基础上的应用软件。在淘宝网,我们的应用服务器上采用的是Linux操作系统。Linux 操作系统从1991年第一次正式被公布到现在已经走过了十七个年头,在PC Server上有广泛的应用。硬件上我们选择PC Server而不是小型机,那么Server 的操作系统供我们选择的一般也就是Linux,FreeBSD, windows 2000 Server 或者Windows Server 2003。如果不准备采用微软的一系列产品构建应用,并且有能力维护Linux或者FreeBSD,再加上成本的考虑,那么还是应该在Linux和FreeBSD之间进行选择。可以说,现在Linux和FreeBSD这两个系统难分伯仲,很难说哪个一定比另外一个要优秀很多、能够全面的超越对手,应该是各有所长。那么在选择的时候有一个因素就是企业的技术人员对于哪种系统更加的熟悉,这个熟悉一方面是系统管理方面,另外一方面是对于内核的熟悉,对内核的熟悉对于性能调优和对操作系统进行定制剪裁会有很大的帮助。而应用全面的优化、提升性能也是从操作系统的优化开始的。 应用服务器 在确定了服务器的硬件、服务器的操作系统之后,下面我们来说说业务系统的构建。淘宝网有很多业务系统应用是基于JEE规范的系统。还有一些是C C++构建的应用或者是Java构建的Standalone的应用。那么我们要选择一款实现了JEE规范的应用服务器。我们的选择是JBoss Applcation Server。JBoss AS是RedHat的一个开源的支持JEE规范的应用服务器。在几年前,如果采用Java技术构建互联网应用或者企业级应用,在开源软件中的选择一般也就是Apache组织的Tomcat、JBoss的 JBoss AS和Resin。严格意义上讲,Tomcat和Resin并

淘宝发展历程概述

淘宝发展历程概述 淘宝网是亚太最大的网络零售商圈,2003 年成立,目前占中国网购市场70%的份额。天猫在2012 年的销售额开始超过淘宝网,未来这一差距还会扩大。我们要了解淘宝,首先要了解淘宝的基本规则和基本搜索规则,知道开店的基本流程和店铺的基本安全要求,熟悉淘宝的交易流程和基本的店铺运营知识。淘宝店铺的运营,我们会关注:产品,流量,转化,会员。从这几个方面入手,根据自身店铺的情况去操作,解决实际过程中的问题,围绕店铺运营的目的是提高销量,做好店铺运营各项基础工作,优化流程,提高效率,店铺才会继续发展。淘宝品牌的三个维度:知名度、美誉度、忠诚度。以卖货思维运营品牌,就可以尝到盈利的甜头:卖的多了就是知名度,产品和服务做的比同行好一点就是美誉度,二次购买做的到位一点就是忠诚度。这也是店铺运营的一个思路。店铺的经营管理也至关重要。淘宝店铺的运营是关乎网店成败的关键,学好以下四点为店铺打好基础平稳发展。一、淘宝店铺运营——上线及日常管理:(1)确定店铺的整体风格,做好各个区域的美工工作。(2)细化买家须知内容,尽量做到顾客可能自主购物。(3)美工负责将待售产品的图片做好处理,编辑配置好相关的文案说明。(4)编辑好各个产品的标题,宝贝描述后,核对价格及库存信息后,全部上架。二、淘宝店铺运营——营销活动。(1)首先确定好3-5款主打的产品,以后历次活动优先考虑这几款产品的报名,以些吸引客户,做好关联营销。(2)配合淘福的新店铺的初期和中期的推广活动与宣传。

做好庆店营销活动,全场折扣,设置VIP 折扣价格。(3)设置淘宝客,淘帮专场等活动,以此引进流量。三、淘宝店铺运营——售后问题(1)委任有经验的,沟通能力强的客服担任售后工作,(2)细化各种售后问题,作为应对方案,比如安抚客户的不满情绪:不同的情况对客户的损失如何补偿,快递丢件如何索赔,如何追件,如何跟进货物运输过程及其他相关售后问题。四、淘宝店铺运营——配送及仓库管理。(1)仓库管理人员应及时核对库存信息,和编辑保持沟通,避免店铺出售状态的产品实际无货情况的出现,缺货的产品及时下架。(2)发货周期一天一次,除有活动的订单较多的情况外,订单一般要在24小时内发出,最迟不能超过48 小时,如果遇到缺货或其他问题不能及时发货的,及时通知客服,联系客户沟通,做好换货或退款事宜。极力避免缺货没有及时和客户沟通导致客户严重不满的情况出现。

淘宝发展历程概述

淘宝发展历程概述 5月10日,是淘宝10岁生日。 2003年4月,马云秘密派出一支9人小团队入驻城西湖畔花园小区一幢小楼里,签了保密协议,没日没夜研发一个月,淘宝网在2003年5月10日正式上线,网面上挂出的200多件“商品”全是几个技术人员从自家拿来的闲置物。20天后,淘宝有了第1万名注册用户。 6月份的一天,马云收到一封极短的内部邮件:“请注意,有一个叫‘淘宝’的网站出现了。” 2003年7月7日,阿里巴巴正式宣布投资1亿元开办淘宝网。 淘宝对阿里的意义、中国电子商务的意义无用多说。在它十周岁的时候,我们来简单回顾下它10年间产品与形态业务的发展。这件事最好玩的是,淘宝一开始是作为阿里的一支轻骑兵出击,发展到后来,除了衍生出跟C2C相关的业务与产品,还逐渐裹挟了越来越多的阿里业务,再到后来,又不断甩出业务进行拆分,直到现在——它已把自己变没了,成为阿里巴巴集团的一块丰厚土壤,而不再只是一类果实。

10年里,淘宝完成了从一种产品、一种服务,到一个生态与平台的进化。从有到“无”,这是淘宝最大的成功。 这个过程,不可能来自马云等人从一开始就有的设计。但是我们确实能体会到,马云对业务人事在不同阶段的收放手腕与节奏安排。把小公司做大,又把大公司变小;把业务做成生态,让生态去哺育出更多的创新。 2004年,推出“淘宝旺旺”,将即时聊天工具和网络购物相联系起来。 2005年,淘宝网超越eBay易趣,并且开始把竞争对手们远远抛在身后。5月,淘宝网超越日本雅虎,成为亚洲最大的网络购物平台。2005年成交额破80亿元,超越沃尔玛。 2006年,淘宝网成为亚洲最大购物网站,就在这一年,淘宝网第一次在中国实现了一个可能——互联网不仅仅是作为一个应用工具存在,它将最终构成生活的基本要素,调查数据显示,每天有近900万人上淘宝网"逛街"。 2007年,淘宝网不再是一家简单的拍卖网站,而是亚洲最大的网络零售商圈。这一年,淘宝网全年成交额突破400亿,成中国第二大综

相关主题
文本预览
相关文档 最新文档