分享到:
  • 主持人:大家下午好!今天非常高兴请来了类似于乐蜂网的同事来到了这里,我很高兴见到了四年前在新浪工作时的同事童剑。
  • 童剑:大家好,我在新浪已经很多年了,一直在新浪的研发部门做的主要都是新浪的一些基础性的技术平台,包括其实早期的一些新浪内部私有云的平台,以及一直在尝试做公有云的产品,因为大家都很关注我们的一些产品。
  • 主持人:童剑在新浪也是一个风云人物,可以留下一个号码留在人民大学的墙外。介绍完新浪之后肯定要介绍一下它的好基友张曙光。
  • 张曙光:我是搜狐的张曙光,我跟童剑是老同行很多年了,业界里经常说 搜狐和新浪是好基友,其实我们技术圈里面交流的形式是非常好的,非常高兴来到这里。
  • 主持人:玩儿游戏的同学有吗?那么由你来做一下自我介绍,光宇游戏的CTO。
  • 光宇游戏:很多老朋友也有一些新朋友,我是沈威光宇游戏的CTO,我自己最早2001年开始做游戏的运维,对运维工作还是挺感兴趣的,我在04年到的光宇,主要还是做游戏平台的研发还有运维工作。这两年游戏像我们这种公司不是太好过,因为靠老本在挣钱,盈利还不错但没有什么故事讲,也不太受业界的关注,我们在01年之后基本上都切入到了页游和手游里面了。它自己的特点决定了我们对游戏的价格要做调整,所以最近也非常关注云计算、虚拟化、大数据,跟很多朋友也有很好的交流,今天来到这儿很高兴认识大家,跟大家好好地学习一下。
  • 主持人:等会儿走的时候留下几款游戏的VIP账户。我们再介绍几位同学,也是做车行业的,只不过今天跟我们汽车之家应该算是合作伙伴,不算是友商,有请神舟租车范同学。
  • 神舟租车:我们主要是内部的应用做得比较多为主,因为跟赵总是比较类似的,在大数据这方面其实有很多的数据非常有价值,但现在没有挖掘出来,比如说客户坐我们车导航的一些信息和轨迹,所以今天来主要是跟各位前辈们请教和学习的。希望大家以后能够多家了解。
  • 主持人:还有哪些新同学来做一下自我介绍?
  • 搜狐汽车:我来是搜狐汽车,我是一个互联网的老兵,我在新浪呆过、搜狐也呆过,汽车领域我是一个新兵,也是刚入行,我今天是抱着学习的态度跟大家流交流的。
  • 主持人:今天其实聊的很多的话题都围绕着今天的三个主题,一个是大数据然后是云计算还有BYOD的移动方面的,有很多是关心什么呢?是前两天的光棍节,双十一,关注的是你跟谁过的而不一定是你在网上买了什么,买了东西大家也都知道淘宝天猫当天24小时的销售额达到了350亿。这还是一个保守的数据,马云给我打一个电话说今年不能超过350,要不明年没法儿做了,所以今年稍微控制了一下,因此就冒出了非常非常多的原来属于传统的互联网公司开始搞电商了。对我们乐蜜网这种小公司冲击非常大,尤其是双十一卖到20亿的汽车之家,我们很想关注贾总在这20多亿里面拿到了多少?跟大家聊一聊,该说的不该说的你稍微讲一下。
  • 贾志峰:双十一我们第一次做,做汽车行业第一次做双十一的有很多的经验可以积累。我们公司纯粹把这件事情作为一次试水,我们投入了大概5000多万的市场费用目的是想试一试大宗商品做电商到底是什么样子的。待会儿跟大家分享。
  • 主持人:埋的题还是挺深的。刚才都是男同学发表了自己公司和自己的一些想法。
  • 主持人:在座的各位同学请大家调整一下情绪把你们的目光向我。今天由IT168举办了这样一次轻盈IT无大不同·汽车之家主张这样一场非常非常激烈,全程无尿点的头脑风暴,本期的主要议题是当下最热的一个BYOD移动应用组,云、大数据平台。本次活动我们要感谢主办方,因为有了他们才把所有的技术人员汇集到一起,一起分享,所以让我们用热烈的掌声欢迎IT168的申安安。有请!
  • 申安安:非常感谢大家能够今天抽出时间来参加我们这个技术沙龙活动。在这里我要跟大家重新介绍一下IT168CIO俱乐部的情况,今天跟大家交流的是IT168CIO、CTO俱乐部一起 举办的走进明星企业汽车之家,希望先进的互联网企业可以分享他们的经验,在这里我感谢大家跟我们积极交流,多多跟我们分享您的经验。本来致辞应该由我的美女领导来做详细的介绍,可是今天我们有一点拖堂先这样。
  • 主持人:我们想邀请美女来演讲一下。
  • 胡明娅:首先欢迎各位CIO、CTO们来光临我们IT168主办的这次活动,我是IT168企业采编部的胡明娅(音)。今天我们的主题是从互联网的角度分享一些内容,我们也很荣幸地邀请到了业界非常重量级的嘉宾还有汽车之家的贾总来给大家做分享,期待今天的活动圆满成功。谢谢大家!
  • 申安安:我非常感谢戴尔给我们这次机会,把这么多互联网的巨头聚集在一起,还有这边传统行业的巨头们。我希望今天能够碰撞出更多的火花,大家能够交流出更多精彩的内容。再次感谢戴尔的同事。现在我把时间交给我们的帅哥主持人毫无尿点的周老师。
  • 主持人:这个尿点不能往人身上比喻。谢谢各位!非常感谢本次来主持的互联网界非著名主持人乐蜂的邱野。互联网是非常开放的,我们是为IT代言,所以今天我们非常荣幸地请到了几位IT界的巨头,几位互联网的老兵,有请第一位汽车之家的CTO贾志峰为大家做一场技术分享,下一代互联网如何改变生活。掌声有请!
  • 贾志峰:首先感谢大家来参加这个IT168的活动,知道大家平时特别忙能够过来非常不容易,所以我也希望在接下来的几十分钟里跟大家分享一下汽车之家做的事情,让大家了解一下汽车之家是什么样的企业以及我们的技术做了哪方面的工作。第二,我觉得还是要感谢一下IT168给我们一个机会来聚在一起做思想上的碰撞和交流。同时我觉得每一次分享作为主讲人实际上是非常中往往可以得到更大的收获,希望大家在接下来的活动中有机会的话也争取支持IT168多当主讲人。
  • 贾志峰:先向大家声明一下前段时间非常忙,在忙着做双十一活动,所以PPT组织得很仓促,要在30分钟之内讲完挑战还是有一些的,所以每一页不会讲的特别细只是一个抛砖引玉,大家接下来有什么更详细的问题可以在互动环节中多多交流。
  • 贾志峰:首先是今天我想讲的内容,第一,介绍汽车之家是什么样的企业;第二,介绍我们在大数据相关方面做了哪方面的工作;第三,介绍比较有技术特点的传统互联网的应用就是论坛;第四,分享一下我们在双十一的基本情况。
  • 贾志峰:汽车之家简介,本来是有数十张PPT介绍汽车之家,也许大家看到新闻了,我们公司非常有幸在11月4日向纽交所提交了IPO申请,所以市场部门说任何有关公司未来的事不准再改了,任何有关数字的事也不准再讲了,所以我把这10来张PPT被迫删掉,就留下了这一页,叫做汽车之家=汽车+互联网。我们市场部给大家准备了更好的材料,在美国证交所的网站上有我们最新提交的F1报表,里面详细地介绍了汽车之家所有的业务和收入构成,大家有兴趣可以去那,是我们官方最详尽的数据。
  • 贾志峰:抽象来讲,汽车之家是服务于汽车行业的一家互联网公司。所以我们主要服务的是在汽车领域买车选车、用车以及最后置换二手车这些用户。
  • 贾志峰:第二,今天的重点大数据。大数据是最近特别热的一个词,但大数据究竟是什么?我也经常被人问起,汽车之家这么大有那么多的用户你们在大数据中究竟要用一些什么呢?往往我很尴尬碰到了这个问题,这个问题确实是太大太抽象,有点像在2000年的时候人家跑来问你你对互联网怎么看?或者说你对汽车之家要做一些什么?我跟有时候有一些类似。我引用了一个Facebook的CEO说的一句话,他说大数据的数据主要是行业外的人在用,其实我们确实是很难解释它什么是大数据,我觉得这个词的含义也非常模糊,在Facebook我不用这个词。这个回答是非常有意思的,因为对这样一个大的词,我们必须把它具体化、把它切割开才能进行一个深度的讨论,所以接下来我把汽车之家怎么看大数据的讲一下。
  • 贾志峰:我们认为大数据彻底想通主要做好三个层次的工作,最上面的一层实际上是数据产品层,用大数据向最终用户提供什么样的服务,这是最终数据的价值所在。第二是为了提供这些服务我们需要哪方面的数据,这是数据仓库层。我们需要怎么样组织我们的数据,最主要是数据来源,为了产品这些数据我们需要收集哪方面的原始数据,来支持海量的数据,我们认为是在数据运营层方面做的事情。我们的观点中一个大数据对一个公司来讲要想把它做好必须从上到下把这三件事都想明白才能做好。
  • 贾志峰:经常有厂商问,你们有什么样的做法让大家接受呢,他们讲的是数据运营层面的问题,但这个层面做得好不代表大数据做得好,如果想做得好必须在三个层次都做好,这样才能对企业真正有用的大数据。我觉得数据产品层这个层面是把数据价值传输给用户的。
  • 贾志峰:汽车之家我们核心大数据包括了一下五个方面:
  • 贾志峰:第一是精准广告的应用。如果大家看我们的招股书汽车之家的核心来源是厂商、区域厂商和经销商的广告,比如说大众奥迪会把一些广告费用投在我们的网站上,包括卖车的4S店的经销商也会把广告费用投在我们的广告商,这些广告是通过广告系统传递给用户的。我们想的第一个方向是大数据怎么才能把价值发挥出来,大数据加上精准广告是我们目前看来回报最高的业务模式。
  • 贾志峰:第二,是我们做的所谓的指数系统。这是我们做的一款数据类产品,主要是提供一些数据分析的最终结果给我们的厂商用户。在汽车行业,传统的用户调查和用户的分析是通过问卷的方式来进行的你经常去4S店会被门口的人拦住,或者是被销售拦住让你填一个问卷,他会问你一系列的问题,包括你喜欢什么颜色的车,收入是多少。传统意义上指导厂商角色的是通过问卷调查的形式来指导。但因为有互联网的存在,因为有大数据的存在第一次可以在行业里面做到实时全量把用户的访问行为分析出来,直接让我们的厂商和厂商的区域销售能够看到他们的潜在用户在网站上是什么样的表现,用户的分布是什么。我们觉得这一点是互联网的生产方式优于传统的问卷调查生产方式的一个核心点,所以我们把大数据也包装成了指数系统这样一个产品,让我们的厂商来使用。
  • 贾志峰:第三,做了BI平台,实际上是面对内部运营用的,我们作为一个互联网的网站,大量的时间需要分析网站上存在的用户的行为以及他的喜好。比如说一般的互联网企业都会遇到这么一个很经典的场景,按纽是红色还是蓝色,很大程度上会影响转化率,所以我们做了一个类似于分析的平台,能够做ABtesting,做各种各样的分析,把用户的行为拿来做产品决策。同时也聚合了销售端的数据,销售端会跟厂商谈拿到广告的预算,这些广告在我们的网站上是什么样的表现,用户的点击率是什么样子的,也是会聚到平台里做销售商的调整。
  • 贾志峰:第四,很多传统电商网站上做的事情,做相关性的各种推荐,我们会在用户看一款车的时候在旁边显示他可能感兴趣的另外几款车,或者是几篇文章,这是面向用户服务。
  • 贾志峰:第五,这是最近反思之后调整的一个产品,就是在前面月户端各种推荐和传统意义上的不做任何个性化之间我们发现可能还存在一个中间区域,也就是说可以用用户的行为来决定网站上的各种各样的分类聚合。举一个例子你去淘宝上看,你可能看见他的产品分类是成千上万种的,它的组织方式实际上是根据用户行为组织起来的。为什么会把女性衣服组织在一起,它是根据大量的用户行为发现说这一类产品共同拥有同样的一群用户,我们今年年初做了一个类似的事,传统意义上我们把车分为小型车、重型车、大型车、豪华车、跑车,但是当这种分类方式到了SUV的时候我们发现有一个困境,SUV是很不一样的,有特别小的伪装成SUV的轿车,有硬派越野型的就是悍马,有的是城市越野型的。怎么分类呢?汽车之家以前是分成一个大类就叫SUV,但后来我们发现这不是最精确的方式,我们用数据调研了用户的行为分析,把SUV重新做了分类聚合,现在我们把它分成了SUV的几个类别。这是现在看到的汽车之家目前在做的五大类比较重要的数据应用。
  • 贾志峰:为了支持应用底下有各种各样的数据来支持上面的五类应用。
  • 贾志峰:我们从站外拿到了汽车销量数据和汽车上牌照数据,我们可以精确地知道全国汽车用户的比例和在汽车之家出现的用户的比例到底是什么样的关系,我们是在不断地扩大市场占有率还是在不断地持平还是缩小,以及我们跟竞争对手的一些差距。基本上我们的逻辑是从数据产品先思考然后再想支持一种产品需要什么样中间的数据,再去想为了得到中间数据我们需要什么样的原始数据以及如何从原始数据转化成中间数据,这是我们的思维方式。我们经常讲的数据如果只讲其中的一点或者是两点,实际上不足以变成一个解决方案,我们必须把所有的事都想明白。
  • 贾志峰:这个表基本上是今天讲的核心表,看完这个具体到底是什么东西,其实并不是特别重要,因为每个企业都有自己的所处市场的特点,所以大家是根据自己的情况来判断到底是怎么出现在这些层次上。
  • 贾志峰:如何挑选是很重要的它为什么出现在这儿?比它出现在这儿是更重要的。除了刚才讲的采取了倒退的方式,另外在选择五个方向我们基本上是通过ROI标准来做的,我们看一个产品首先我们是判断到底是一个什么性质的问题,有一些产品是一个生死问题,在互联网里面经常会看到一款产品推出来,一个公司就兴起了,若干个公司就倒下了,所以有的产品是生死类的问题。有的是有无类的问题,你有你的对手没有会有很大的问题。这两类的问题我们会来做。第三,你们投入了之后是不是规模化的事。规模化是一个什么概念?投的资源越多回报是比资源投入增速更快的,还有你投入的越多,但你回报并不一定多,我们看到了为什么精准广告是最重要的一个事,是因为首先它是一个有无的事。目前在互联网上我们看到大概百分之七八十的购车用户在某一个阶段会出现在汽车之家的网站上,所以我们有数据上的天然优势,我们怎么发挥它的优势获得最快的利益回报,我们思考了很多的场景,发现精准广告是和我们的场景结合得最好的变现方式。如果你到我们网站上来,我们能够精确地发现你对车的喜好,假如说老是在看宝马这一类的车,我肯定不会再向这个用户打一些奔驰的广告比较合适我如果老打QQ车的广告可能就没有什么作用。通过这样的方式实际上是可以替广告主省钱,同时增加用户的体验,因为广告越相关用户的体验会更好,第一是提高我们的广告收入,第二是能够提高用户体验。基本上是这样的逻辑,我们把所有的可以做的事先梳理一遍,通过计算方式判断他的性质,决定把它放在哪一层,之后倒退实现目标。
  • 贾志峰:这是当时我们做精准广告分析的PPT,我们基本上看了在汽车广告市场上究竟会出现哪几类客户,有的是OEM厂商,有的是区域的负责一个大区的,华北区的奥迪的销售公司,另外是经销商4S店是覆盖某一个城市某一个销售的店,再一个是中小品牌的广告主,这指的是一些销售做汽车服务类的,比如说换一个轮胎去某一个商店打一个蜡是我们有很多家的中小广告主有广告需求,还有后市场的是卖汽车配件和装饰品的,我们根据客户数量和需求决定我们需要用哪种广告显示的模式。最后发现我们现在的广告系统因为没有精准基本上可以覆盖到OEM厂商就结束了,底下的三类广告主现代广告系统没有大数据的支持我们没有覆盖得到。一旦大数据出来之后,我们基本上可以覆盖到市场上所有可能出现的广告主,通过这种方式我们决定要做精准广告。
  • 贾志峰:做精准广告怎么保证我们做得比其他人好?市场上很多广告公司都在声称他们在做精准广告,大家都在做为什么你的效果就比别人好?我们第一发现有大量的用户占市场上决大份额的会出现在我们的网站上,所以我们天然比别人有更多的数据,我们挖掘的层次比别人多,前几类都可以挖掘出来,做用户的属性,关注的产品我不太确定,因为很多广告公司在汽车行业所谓的精准是来过汽车之家我就不是很确定了,我们的精准关注产品可以做得比别人更细,因为有全量的用户的访问轨迹,你老看宝马不可能是QQ的用户。
  • 贾志峰:第四也是比较有意思的我们做了深度的挖掘去分析一个用户的消费阶段,我们发现用户选车的过程是很有意思的,一开始用户可能会同时看十个品牌,会不停地看。随着信息量越来越大,会做出一些选择和放弃,然后到最后会到一个比较阶段,大概也就四五种车了,我们形成了一个来回比。到最后我们关注某一两种车的价格,基本上到了锁定的阶段了,我已经认准了要找宝马了我就找找价格,哪个价格合适就出手了。基本上这个阶段大家会大量地看价格信息,最后是购买是他已经出手了,决定跟一个4S店发生购买的请求。基本上通过这种分析能够粗略地判断出用户处在哪个消费阶段上,是没有什么主义已经在海选的还是说到最后已经锁定快要下定决心买了。针对阶段广告主可以做针对性的广告宣传的。在关注阶段大家更注重的是品牌效应,我们会展现更多的品牌类的信息给他。比如说宝马增加操控性这一类的。奥迪是坐着比较舒服。
  • 贾志峰:到了快要锁定的阶段更关心的是效果类的广告,再打品牌的广告已经没有意义了,这时候实际上应该打一些降价促销类的广告。通过这个阶段可以让不同的广告主针对不同的需求有针对性地打广告这也是目前看来在其他的广告网站上做不到的,因为他们不可能全量地追踪用户的行为,而汽车之家可以做到,因为我们是严密的关注所有用户的所有行为。这一点上我们比较有信心,广告上我们的效果会比其他的同行更好。这是一个测试的结果,基本上一旦打了广告之后,基本上现在的广告的效果比以前要成倍提升。道理很简单,市场上需求就这么多,需求实际上是不会变的。效果实际上是点击率除以展示量,我们把展示量做得更精准,分母更小,需求是不变的,效果一定是更好的。
  • 贾志峰:我们有很多市场分析的需求,厂商实际上是最终极的需求,假如说需要了解消费者群体的规模及趋势变化,潜在用户是越变越多了还是越变越少了,这是推广行为的传播有效性,还有,他想知道说我这个产品究竟和市场上哪些产品在竞争,这些都是一些很重要的信息对厂商来讲都希望知道,而在以前一般是有一个部门专门做市场调研,或者是请第三方公司来发问卷。我们实际上是可以组织成关注指数的指标,把它呈现给厂商,基本上可以实时地指导今天的排名是第几,有多少人关注这对他来讲是挺有价值的一个事。我们基本上关注的是关注指数、兴趣指数、意向指数、行动转化。对应的行为是浏览行为、交互行为、询价对比、交互线索,浏览是很看戏,交互是我已经对这个车产生兴趣了,我想知道说这个车到底怎么回事,可是文章没有给我信息,我开始在论坛里问,我问一些车友到底怎么样,或者谁能知道这个车到底是噪音大、噪音小,基本上大家不会看到你。第三是他已经发生意向了,更多开始比价了,我们有一个比价产品会看到很多人把几款车拉进来一起比,我们有一个爆炸页更多的看有没有降价,会问有没有降价的事。最后也就是销售线索,他会真的打咨询电话或者是产生线上订单,通过这种把我们的用户行为进行分类就可以给厂商提出四个指数,告诉用户群到底是什么样的,是不是他们的行为发生了转化。
  • 贾志峰:这是二期,基本上做了一些竞品分析,不仅要了解自己还要更希望了解竞争对手,我们会让你做对比,你跟你的竞品的指数PK是什么样的,同时看了宝马和奔驰的人是多少,宝马用户中间有多少人同时也是奔驰的潜在用户,这是潜在客户的重合度分析。所有的指标按地区和品牌、按车系都做了分类,可以察看任何一个地区的数字,比如说可以察看北京地区是什么样子的,上海地区是什么样子的,所有的指数都是可以不断细分不断切的。再有订单转化率是什么样的。我们在2013年底和2014年做的分析类的产品。这些做完了之后基本上给厂商提供一些数据类的产品服务。这是给自己用的叫BI平台,我们做了用户访问轨迹的分析。因为市场上有很多类似的产品,比如说GA这一类的传统的网页分析产品,我们在用GA的时候碰到了一个问题,好像GA的免费版用到什么样呢,可能在2011年的时候网站整个PV已经超过了GA免费版允许的值。所以我们被迫在网站上做的一个抽样,抽完1/10样本之后结果不太好用,没有办法我们也不敢用百度的分析类产品或者是其他的分析类产品,因为在中国可能有一些数据上的顾虑,我们自己做了一系列的用户行为分析的产品,基本上都是自己做的,因为到了这个规模外面的产品就不能做了,这是我们做的用户访问轨迹分析类的截图,我们用户有多少的人次可以做产品部门来决定产品是不是合理的。这也是给我们的销售部门用的,跟前面也是类似的,这四个销售漏洞,人进来从关注到认知到喜好到潜客到线下成交以及中汽协的销量,可以知道全中国有多少的销量发生在我们的网站上。我们会看到转化成销售线索的变动趋势是什么样的,如果有一个改版改完了之后我们知道这个改版就需要怎么做了。
  • 贾志峰:现在讲大数据很多人实际上说的代名词就是行动推荐。因为我们分析来分析去总觉得这个事投入再大回报跟投入的比例不是划算的。所以我们没有花大力气把它做得特别完美,我们最起码做了几大类,在用户网站上看我们的车的时候会推荐类似的车。用户在看一些文章的时候比如说看游记的时候会看类似的文章,还有口碑的推介,我们会推介在用户看一个车的时候会按口碑的排行给他推介。再就是我们还做了一个事把二手车网站和汽车之家主站做了cookie的打通,汽车二手车在几年后面对的是有同一群购车需求的人,现在的汽车用户购车大部分是倾向于购置一手车,一说买车潜意识是买一手车,大概在三五年之后这两类人会是一类人,因为我们已经看到了成熟市场是怎样表现的。我们现在汽车销量80%是新车,20%市二手车,我们一直在关注这个数字。当比例达到50%-50%的时候,这两类人就是一类人。所以我们把这两类人的两个网站的cookie都打通了,可以看整体的用户的分析。
  • 贾志峰:接下来是SUV分级是怎么做的。基本上通过用户访问SUV界面的行为,他会知道在用户心目中哪一些SUV是真正的SUV。用的术语是钢琴图,这两类是一类,用钢琴图把它分成了大概五大类。这些事的意义是基本上汽车之家原来所有的事是编辑在做,编辑的专业程度决定了这个事的专业程度,后来发现很多用户比我们的编辑更专业,用户对汽车的了解以及对行业的了解可能是我们编辑赶不上的。对我们的一个问题是如何用用户的智慧来决定我们网站的走向,这是其中一个尝试。另外我们还做了一个尝试在用户买车的时候我们发现了异地提车的现象,比如说是北京的用户,但买车的范围不局限于一个地区,但对用户来说哪些用户归属于一类,我们编辑也不知道。比如说是石家庄的客户是归属于北京还是归属于天津我们是不知道的。类似的我们也做了用户的选车范围的分类,我们把用户的行为进行了分类,都收集起来做了分类,以后当用户出现在我们的网站上的时候,不仅仅能看到石家庄车源的价格,也同样能看到石家庄的用户认为其他几个临近城市的车的价格。大的逻辑是用用户的一些行为来优化网站。
  • 贾志峰:刚才简单讲了一下上面的几个数据产品类的几大块是怎么做的。中间其实是非常自然的一件事了。为了完成上面的几大类,中间肯定是需要数据的,这个事是一个基础的事,我觉得可能对在座的技术高手来讲都不是难事。基本上2001年开始做技术选型,10月份开始开发。我们现在有100多T,每天大概80G的日志,数据量来讲不算太大,但在行业里面也OK。计算性能原来的数据计算是在数据库里跑的,上了Hadoop之后,数据更稳定、速度也提升了,扩展的时候加服务器就行。我们把用户的一些典型数据比如说阅读统计、重合度和访问轨迹,包括前面打标签的一系列的事。还有我们今年做的一个Storm的流式计算平台。和Hadoop做互补。我们在做精准广告的时候发现大部分的用户是回头客,大概40%到30%的用户是因为换的浏览器是第一次到我们的网站上,按照Hadoop的离线计算的方式是一天来一次,当天来的第一次的用户Hadoop是没有数据的,我们不能根据他的行为来对他进行判定,为了弥补这个我们觉得40%是很可观的一个人群,为了弥补这个缺陷我们做了一个流式计算平台,基本上是实时的人进来之后我们通过日志分析进入Storm可以给用户打上标签,下面的广告可以推出去。我们基本上能够通过这种方式做得比原来更好。当他到第二天变成了回头客的时候就可以算出来了。
  • 贾志峰:第三,汽车之家的论坛。刚才讲的基本上是大数据相关的事,接下来讲论坛。
  • 贾志峰:汽车之家论坛是全球中文社区里是第三,百度贴吧和天涯会比我们大,我们今年的目标是超过天涯,变成除了百度之外的第二大论坛。接下来是日军PV是5000万是很大的规模。我们的目标基本上是让每个页面都一样快,提高用户的体验,做了自己有特色的一些优化,论坛基本上是我们自己写的,我们在论坛里引入了一个Redis,把论坛的翻页存储在redis里面,达到最后一页的时间一致都是O(1)。第二,一旦帖子发布了以后,修改量是很少的。虽然是动态的论坛大部分是静态的内容,只有当用户更新的时候我们才能清这个cache,这样整个论坛的速度会非常快。接下来用MQ挡一层就不会让业务的压力直接在系统上。
  • 贾志峰:第二,我们做了凤凰模式,我们的系统确实有不稳定的地方,我们在前台搭了一个cache,主要的目的是把用户屏蔽掉,我们先触发到cac he上,它先看原站是好还是坏,如果反馈是坏的,他就会把原来存储的老内容返回去,基本上我们能做到任何错误不会在用户端体现。同时我们做了双机房部署,当一个机房出现问题的时候又切到另一个机房。再就是一系列的用storm做的一系列的监控。当流量发生异常和用户访问速度发生异常的时候都会发现。这是我们用storm做的,我们直接写到Hadoop里面,我们涉及到的是一条日志延迟1秒之内,有任何系统的问题都会在里面看到。
  • 贾志峰:今天大数据就是这些,总的体会是大数据有点类似于2000年的互联网和前两年的云计算,本身的价值是市场能用起来,人家可以把数据用起来转化成产品,产品转化成收入,这一系列的事都相通之后,大数据就是有意义的。我们的思维方式是以终为始、业务模型先行。先想什么样的技术手段和数据怎么产生,同时大数据是整体规划的策略,不能说先想到系统然后就上了,资本投入可能是非常大的。
  • 贾志峰:这是我自己的一个展望,我觉得未来可能大家就像水一样,大数据是一个必然存在的东西,任何一个大型的互联网公司可能都会有这个事都会做大数据的事,你不做肯定是不行的。
  • 贾志峰:最后双十一,我们双十一当天24小时每分钟是367万订购额的,我们是没有收用户的车款,我们是用订购额来算的。一共卖了17776辆车,数量对系统压力是很小的量,因为淘宝是几亿订单,对系统挑战不是那么大,但业务上来讲是挺不错的,因为是第一次是把大额的商品搬到互联网上来卖。销量基本上相当于北京一到两家4S店一到两年的销量。
  • 贾志峰:每分钟是20多辆车被订购。当天人数是230万人到访。系统压力不是很大,但我们做的时候还是做得很认真很小心,因为第一次做谁也不知道量有多大,确实经验不够。所以我们做的架构基本上是这样想的,我们把系统的静态跟动态安全切分开。用户的浏览和搜索是在左边这一部分,用户的支付和下单是在右边这一部分,两组完全不同的服务器。
  • 贾志峰:浏览跟搜索是做了两层的,除了CDN我们自己做了两层的缓存。还有我们自己做的一个内部开发的系统。再下面就是4台web,最下面是数据库。最后下来发现量是远远超出了用户的访问,所以基本整个系统没有什么压力。这边是下单和支付,一排服务器,下面是做MEQ做的是比较慢的响应的事。最底下是有很多的数据库,主要是保证数据库的读写压力能够分担,因为用户下完订单之后马上会看,看完之后会把它挪到上面去了。我们做了一个流量控制,因为我们当时不知道水深水浅,所以不知道有人会点什么样的按纽,当然也怕恶意攻击,所以我们页面上会有流量控制的服务器,会根据我们的指针来调节放多少量过来,如果流量允许过才可以下单,流量控制这方面我们用是三台NOGS(音)来做。我们在另一个地方也部署了一套缩小版的架构,当然是为了防止主机房可能会出现问题。这两个机房实时做了数据同步,NOTEGS也是,我们租了云主机,也是怕机房出问题,这是一个备用的流控,起码把几个大的事都考虑到了。当天整体来讲是非常平稳的,没有什么压力。后来我们算了一个账,中国大概一年的汽车销量是2000万,所以实际上我们可以反推出这一天的量大概是多大,我们发现系统按照目前的规模是能够承载中国大概大半年的销量,设计者考虑得比较多。
  • 贾志峰:经验分享都是很简单的,非常朴素。第一是反复演练。11月1日至11月11日排练了四次,我们想在准点进行切换。在双十一之前是不能让用户下单的用户只能看而且看不到价格,在双十一的一瞬间我们需要切过来,让用户看到价格。在双十一结束的时候马上要屏蔽掉,所以光切换页面演练了四次,写了很多的文档,我们有9页纸的配置文档,33页上线文档。还有预案,每个点都想到如果坏了会怎么样,如果流量压力不够了会怎么样,包括机房和数据库。第四,要感谢还是有很多合作伙伴在支持,包括了供应商当然为了防攻击临时找了360,万一有人攻击我们可以得到专家的帮助,还有戴尔也是临时帮我们订了很多的服务器,还有云主机的Ucloud,我们当天晚上协调了云伙伴的支持。基本上经验就是这些,从技术挑战来讲,我觉得跟天猫比也是不可相比的。
  • 主持人:可以针对刚才峰哥讲的内容可以有提问。提问是有礼品的,汽车之家与汽车相关的活动大家得会想到一个礼品是车模。
  • 提问:从BI的角度已经分析得很详尽了,有精准的广告定位。单用户不是初次体验,更长的是整个生命周期是在服务和后期。所以不知道您对后期服务信息或者是数据采集有什么样的考虑?再一个,大数据如果仅仅是堆积在那是没有用的,要挖掘一些数据把看似无关的数据结合起来变成相关,售前和售后的数据总有一些潜在的相关性,有没有新馆的考虑?
  • 贾志峰:问题非常好,第一个问题是售后数据机业务怎么考虑。第二是数据相关性怎么考虑。第一个问题,汽车支架定位是汽车加互联网,汽车自己看是包含了四个环节,第一个是选车。第二个是购车,第三是用车,第四是置换车。汽车之家目前做的事情重点是在选车上,原因是我们大部分的用户他们来买车目前看还是第一次买,所以信息的传达是他们最需要的,所以历史上也是有这个开始才有了汽车之家,大部分的工作是选车类的工作。现在我们做电商和任何交易类的产品做销售线索都是慢慢地想满足这些用户下一步的需求,再接下来购车完之后肯定有用车的需求,再接下来有二手车置换的需求,我们会按照产业链一步一步地走下去。目前公司毕竟是资源有限,是在有限的资源下做尽量多的事,目前的资源大部分在选车和购车,我们在汽车之家是可以看到全国很多城市换胎和打蜡的服务商的信息,但我们对深挖还是不够的。也许在未来我们可以会做到。
  • 提问:刚才双十一的IT架构和平常的架构比大概是几倍的规模或者是扩张了多少?你们这个架构应该都是自己的服务器,自己的机房是吗?
  • 贾志峰:主要是自己的机房。
  • 提问:比平常大多少?
  • 贾志峰:双十一这一次用的服务器比较多,比平常要多,是几十太,我们主体业务是一个很庞大的量,可是双十一本身是用了几十台的服务器的规模,我们是第一次做双十一,平常业务和这个业务的模式不太相象,可比性不太强,压测大概是按照每秒钟3400的下单量来进行的。但实际上下单量是远远低于这个数的。
  • 提问:平常是10台服务器,这时候用 几十台大概是什么样的比例?
  • 贾志峰:这是我们单独部署的,平常的服务器说出来跟这个相关不大。
  • 提问:大数据这块讲的非常透彻,我想了解一下汽车之家是如何保证IDC的数据安全的?
  • 贾志峰:问题是很好的问题,首先是数据安全,大数据肯定是收集了很多用户的信息,是用cookie的方式来收集,我们没有直接收集用户的敏感信息而是访问日志,所以这部分的日志泄漏之后把市场上人拿到是不会危害到人的隐私的,我只知道cookie访问了页面,但没有交易额。第二是如何做数据安全的,我们还是按照比较传统的方式来做,首先是在机房里是内外隔离,通过堡垒机进去,跟其他的互联网公司做得类似。我们的数据文件基本上是加密的。
  • 主持人:谢谢提问的。刚才有很多人发来贺电恭喜汽车之家在双十一成为最大的黑马,你们改做汽车销售的行业,我们更关注的是汽车之家能不能帮助大家解决北京买车指标的问题。我们今天非常感谢峰哥给我们做的非常有干货的分享,如果大家有提问可以发新浪微博到轻盈IT,把你想要问的一些问题,想要挖的一些事情可以写到里面。
  • 主持人:因为我们技术走在互联网领域里前沿的一些好玩儿的东西,突然间有一点我去我们的公司一个集团副总裁的办公室里的时候发现他的办公桌里放了一本大数据时代,所以我们就想我们做技术的人的日子也不是特别好过了,老板们都开始研究技术了。接下来在环节中也是包括了促销,例如说像今年汽车之家做到20多亿,老板爽了这把之后有可能接下来会想着周年庆典的活动,有可能接下来的势头会越来越猛。接下来我们有请另外一位演讲嘉宾是戴尔的资深企业解决方案经理尹玉峰,他为大家聊一下用大数据的眼光驱动业务发展。
  • 尹玉峰:首先很抱歉今天迟到了,最近关于戴尔在市场上有很多故事,上上礼拜五这家公司结束了作为一家公用公司的历史,从纳斯达克退市了,到现在一些新的政策和战略正在制定和推出,总的思路比较简单,就是更好地创新,我想业内人士对这家公司还是有一定了解的,86年一个大学没有毕业的学生就在车库里攒机器,88年上市,深市的时候比现在的Facebook的老大扎克伯格还年轻,戴尔公司上市的时候才21岁,19岁上大学两年之后就上市了。坦白说世界变化太快了,IT变化的脚步在方向上有一些分歧和不同的看法,所以我们寻求了另外一种发展的方式退市,能够更轻盈地更有创新力地驱动产业。我们这些家公司最初之所以发展这么快,20几年的时间就能从这么一个小作坊到这么一个快速成长的公司,一定有很多的业务创新,其中自然也少不了大数据来驱动和带领业务创新。
  • 尹玉峰:说到大数据,我讲一个小故事,创始人在大学一年级创立了这家公司,在上高中的时候有了一个用大数据做生意的一个案例。当时在高中的时候迈克·戴尔跟很多的高中生一样在街上卖订阅的报纸。假设我们每个人都接到勤工俭学的方式来卖报纸怎么样找到目标用户呢?正像我们所说的漏斗的管理,他分析过得克萨斯州的城市的电脑号码黄页,当时相当于我们的大数据了,怎么在里面抓出有价值的信息来,最快地抓到目标客户,经过分析之后个人用大脑做BI,发现所有刚刚结婚的人一定会做一件事情就是从父母家搬出来搬到自己的房子里。往往婚礼一旦结束要办的第一件事情就是订一份当地的时报或者是晚报,他们一定是最容易发现的用户,成功率最高的,他利用这种方法用黄页和结合婚姻登记找新人,取得了非常大的成功,还没有上大学就拿到了自己的第一辆宝马车。
  • 尹玉峰:坦白说今天作为厂商可能会卖一些广告,不单纯是这方面的交流,如果广告多请大家海涵。现在的数据从我们的角度来看无非是两种类型的数据,一种是结构化数据和非结构化数据。如何从两种数据里面抓出有价值的信息是我们做大数据或者是做商业智能这方面的工作。传统上我们所接触到的大数据往往是来自于结构化数据,现在的时代更多的数据是来自非结构化数据,并且作为我们是一个制造业,戴尔本身是信息产业提供者,同时也是制造业的制造者,我们很多大数据不是来自于人而是来自于机器,在生产性和供应链以及运输零部件整个的系统管理里面会产生很多大量的数据,而对这个数据进行挖掘优化是和现在我们看到的互联网的大数据还是有所不同的。
  • 尹玉峰:一方面收集数据,另外一方面也是和客户走得特别近,坚持倾听客户的心声,因为知道戴尔这家公司是直接 客户接触的模式,相对而言很多传统的厂商通过一级又一级的分销机构和客户接触,厂商要知道这个客户最新的想法是需要经过一级又一级的客户的想法,再结合现在大力推广的互联网社交媒体这方面的工作。在此,我说一下我们对大数据应用的另外一个案例。刚才我们说很多事是从制造业和机器产生的数据,现在说的例子是从社区从 流量上怎么挖掘有价值的信息。戴尔分析功能是在美国,和主流的一些社交媒体比如说Facebook、Twitter进行合作。经过大数据的提炼,挖掘出有效的销售机会。到现在为止截止到上一个季度,通过社区大数据处理带来的销售机会以及成交量,到现在为止戴尔还是排名第一的。这也是一个很好的利用非结构化数据所给我们的销售带来直接的业绩,给我们的业务带来直接的推动和带领的非常好的案例。这是非结构化数据所带来的大数据处理以及带来的业务的收益。
  • 尹玉峰:我们知道戴尔本身是一家开放性的公司,在IT整个产业链里面实际上有两种方式来挣钱,一种方式是我们所说的这个方式,我们所看到的,lessons的方式,尽可能把所有的东西都做得专有化或者是私有化。你要从我这儿获取服务要支出相对昂贵的成本,你的效率会比较高,只需要投入资金就可以的。另外一种方式是戴尔所采用的方式,我们把它叫做轻盈IT或者是开放的方式,本身我们不会有这种专有化的东西或者是私有化的东西,一切是采用标准化的技术和产品。作为IT基础架构实际上是有著名的三大块,一块是计算资源,另外一块是存储资源,第三块是通讯也就是网络资源。这三块里面的哪一块戴尔都没有传统上所见到的大盒子,所谓大盒子是在计算资源没有大型机、没有小型机,存储资源没有高端存储,当然我们也有可是和传统的高端存储又是不一样的,那种大柜子特别高特别大也特别昂贵。网络的角度也不主张推广巨型交换机,以后特别大的大柜子里面支持无穷多个端口,我们是通过什么方式来推动产业界的发展是降低lessons和运营成本就是小盒子。所谓小盒子从计算资源的角度谁用X86,通过分布式计算互联网所用的各种各样的技术和传统产业也不断用这样的方式来扩展自己的计算资源,是X86这种标准化的方式。存储的角度我们也不是特别高的柜子,我们有极高的CPU,极大的缓存提升我们的性能,我们把小的柜子通过并行扩展的方式达到更高的性能。当然单独看一台缓存和计算能力是有限的。当我们的企业规模比较小业务压力比较低的时候,不需要花昂贵的资源买很大的柜子,买一个非常小的。当业务不断发展的时候不断地添加柜子,容量在增加,计算性在增加,这就是现在的两款存储所秉持的理念,这和企业的发展理念是完全一致的。最后一种是网络,网络也没有特别巨大的柜子,虽然我们也有但是那不是我们主张的发展方向。当然现在网络发展方向本身也是和我们这种方向是一样的,包括了思科等等很多厂商也在做这方面的探索,就是小柜子、小盒子,本身是高密度和高集成端口,通过小盒子的水平扩展实现大规模网络的支持。这样我们通过标准化的方式、小盒子的方式、开放的方式来降低原有的高昂的lessons的授权和费用。
  • 尹玉峰:回到大数据,本身我们是提供数据基础架构处理,有哪几部分呢?第一部分显然是计算资源、存储资源和网络资源,要把数据整合,从抽取存储、计算、处理,这是需要硬件来支撑的,这部分由我们的服务器网络存储构成,以及一家合作伙伴Cloudera共同构成大数据的解决方案。除了基础架构之外还有一个软件的技术架构层,因为软件也为应用软件和软件技术层。我们在技术层也开发了data warehouse的快速版,这是用久负盛名的做数据库优化的最著名的工具尤其是做Oracle叫做TOAD CODE的产品,我们在大数据的处理方面有基础这一层提供的工具,和数据库有更好的结合,以及对外在上一层展示数据的时候有更高效的方法来处理,这是数据仓库的快速版,这个版本也秉承了开放的理念,同样一个版本是免费的,可以基于SQLServer等的提供不同的版本。在发展阶段可以使用GA这样的软件或者是收费的,随着发展在上面可以做二次开发和自定义开发。
  • 尹玉峰:回到产品是结构化的、非结构化的容灾和归档几类不同的存储产品。说到大数据后端的存储产品我想再次解释一下刚才的理念,永远秉承非自由化、非专有华化的开放的架构,并且永远秉承分布式处理的理念来处理。这几款产品都是小盒子,自身单独一台的计算能力和缓存扩展能力确实是有限的,这特别适合于我们在业务发展阶段,入门的门槛比较低。随着业务的发展不断地添加柜子,与众不同点是你不需要做任何的手工设置,原来的数据在最初的柜子上,添加第二个柜子的时候,数据会自动地漂移,只需要把新的柜子加入到原有的工作组,像Windows加入域一样都是差不多的,自动会把数据漂移过去,业务负担就得以分担,同时我们的成本非常低。因为本身不需要手工操作,不需要停机,扩展是根据需求来扩展的。我们毕竟业务是一步一步发展的,而不是说业务相当庞大要买一个相当庞大的柜子而是要根据需求来扩展存储。无论是哪一种存储都秉承了这样的理念使我们更容易地接触到先进的技术,更方便地处理他所支撑的大数据,后面有归档数据,面临着数以亿计的文件,这些稳健的管理用传统的文件系统是难以支撑的,所以我们有抓紧的巨量文件系统的对应存储,用在传统的领域尤其是在教育医疗的各种各样的单据,在互联网产业里面,现在我们也在和一些做云盘的企业在合作,有这方面的一些案例。
  • 尹玉峰:今天的内容比较快,和大家分享一点我们在大数据应用的两个领域,一个是机器产生的一个是社交媒体产生的数据带给企业的影响,另外是戴尔所发展的理念通过公开的开放的技术以小盒子的方式来实现分布式处理,无论是计算资源网络资源都秉承这样的理念,让用户以更低的成本来分享这样的技术。我的分享就到这里。
  • 主持人:我们有很多的时候戴尔的人很高兴地看到了经常搞活动,一搞活动就可以跟我们联络一下感情,平时不搭理我们,看我们搞双十一庆典的时候就联络一下感情,更多是希望戴尔的技术专家们能走到企业当中去帮助我们解决实际的问题,我们更需要的是更深层次的技术。今天也感谢峰哥特意替老板过来做了一次分享,接下来我们更多的环节做更深层次的技术的剖析。请大家打开你的新浪微博,我们的轻盈IT把你想说的、想聊的、想了解的内容发到里面,由两位峰哥做解答。接下来的环节是高峰论坛,有请两位峰哥还有一位是我们中国西电变压器板块CIO赵红武先生。
  • 主持人:先由西电集团CIO为大家做一下自我介绍,包括贵公司的一些业务模式和他的企业介绍。
  • 赵红武:我非常荣幸今天能收到IT168的邀请来参加这个活动。我很少有机会能跟这么多互联网的大佬们分享信息化的经验和做法。西电集团做互联网的都特别清楚,我们是做输变电的唯一一家中央企业,我们现在所用的电灯、笔记本所用的电源,所有跟电有关的都是核心都是西电集团在做,因为西电集团是唯一一家输变电的龙头企业。我们信息化也发展了很多年,96年到现在尤其是这几年发展速度非常快,并且我们也在电子商务方面在互联网的移动应用方面做了一些探索,等会儿可以跟大家交流交流。谢谢大家!
  • 主持人:因为我们赵总是从西安赶过来参加我们的活动,让我们用掌声来感谢一下赵总。接下来的环节比较有意思了,比较随意一点了,既然看到了锵锵三人行的活动。三人行必有我师,我准备了很多的问题替大家问一下三位专家。第一个问题是比较时尚的一个话题,跟我们的时尚圈比较挂钩的一个问题叫做转型。大家都听过这个词吧,但在当下行业里提到最多的与公司战斗层面相关的热词就是转型,互联网界、IT界这个词是非常时尚的,很多公司也都是在做转型,但是转型的核心起义其实往往并不在于IT技术的本身,我想听听三位专家给大家分享一下转型的革命对于不同行业都存在着哪些挑战?
  • 尹玉峰:就戴尔自身而言转型是从未停止的,从最初的PC我们都认为是一家PC厂家到现在是一个解决方案供应商,下一步到一个专业的服务提供商,这样的一个转型过程,整个转型的过程涉及到企业战略的发展以及更重要的是 战略确定下来之后,我们怎么从流程的角度保证战略的落地。这实际上靠的是技术的角度来保证战略的落地和执行。这方面我是有一些体会的,随着公司每一次战略的调整都能明显地感觉到,首先带给你的变化是流程的改变,而流程的改变又是通过工具的改变体现出来的,不断有新的工具推出以及变更来支撑整个企业的变革,说简单一点实际上是通过IT的角度来推动和拉动企业的变革。
  • 贾志峰:我觉得这个问题是一个挺好的问题,汽车之家你们用车市场到底要不要做?我觉得再一个互联网行业里面转型是一个常态,包括我们看一些传统的公司互联网的老兵像搜狐从原来的门户慢慢地变成了全方位什么都涵盖的,有微博有视频也有搜狐汽车。所以我觉得转型对互联网的人来讲是每天都要思考的一个问题,作为汽车之家我们自己看自己有四类价值可以提供给用户和厂商、客户。第一是媒体价值,过去的很长时间我们一直在做这部分的价值,我们能够提供给用户互联网上最好最及时的汽车类的咨询报告以及一些评测。后来我们发现用户不再满足于单向地获得媒体信息,更多愿意跟厂商互动因此有了论坛和口碑的产品,还有一个是我的汽车之家,类似于个人空间的产品,第二个价值我们发现自己有的应该提供的是互动的价值。再接下来我们发现用户选完车之后,实际上并不是需求的终点,他在那看文章跟人交互问问题,最终想要的实际上是来买车,我们进入到交易的环节,跟全国的两万家4S店收集价格,发布在网站上,我们把信息可以提供给用户,用户可以通过汽车之家网站直接跟4S店直接做试驾,我们提供了价值,作为汽车厂商和分销商的网上渠道。再下面我自己看到的是还能提供的是数据类的价值,汽车消费行为可以反过来形成闭环反馈给行业,汽车之家是行业里唯一有机会来做的,我们这方面有很多的机会。我们觉得转型是一个必然的事,因为用户的需求在不停地变,用户需求的痛点在不停地变,所以互联网企业的价值是服务用户,我们跟着用户的角度在不停地转型。
  • 赵红武:我们西电是一个传统的制造业,我们这两年跟互联网的碰撞是非常多的,我们双十一天猫对传统企业的触动非常大,我们平均出口一年才200亿,他一天就可以做到300多亿,这对传统企业的触动非常大,传统企业做了很多的尝试,其实不像大家想象的传统企业很落后,信息化的发展也是很先进的,一些比较先进或者是比较潮流和时髦的东西,也在传统制造业有应用。我们知道制造业企业有一个微笑曲线,大家都认为利润来源于前端或者是后端,但是我告诉大家一个真实的情况,制造企业的利润来源于制造,这是真实的情况。微笑曲线的产业链往前端和后端延伸是必要的,但国内所有的装备制造业,支持国计民生的基础产业真正的利润是来源于制造。可是我们这两年也在说转型的事情,一个是企业本身的转型,另外是IT的转型。企业本身的转型我们以前是作为制造环节,制造环节我们要往上下游延伸,要做解决方案提供商或者是服务提供商,未来电网的基础安全运行的服务商朝这个方向来发展,尤其是国内的一些重要的行业都存在机制的问题,因为国家一些垄断的机制也对传统企业来讲是很难做一些事情的,但是也在探索包括物联网的应用都在探索,并且做了一些案例。包括传统企业在转型的过程中上下游的延伸还有往国外的延伸以及现在的ED协同制造,以及远程服务、产品的监测、寿命预测等等,西电的东西电压等级非常高运行的时候100多万V,西电的产品到底是好的还是坏的,产品的故障检测寿命预测都必须有基于互联网的应用系统来做这样的事情。从企业的发展来讲,企业自身的发展就要求我们IT有很大的支撑,企业自身朝企业发展有很大得知成。
  • 赵红武:从IT角度来讲,我搞IT的角度时间比较长,搞16、17年一直在搞企业信息化,说是搞信息化大家是互联网的先进企业,我们是相对封闭的环境。IT在企业里一直是处于花钱的地位,不产生价值。很多领导认为管IT的人要跟领导谈什么事情就是要钱,其实我要是在西电慢慢里纠正这个观念,IT是有价值的,我们原来定位在企业的成本中心,现在我们要把IT定位到企业的利润中心。让IT产生价值卖出去。后面我会继续谈一些想法。企业不但本身要转型,IT也要转型,理念和IT技术融入到企业的产品中,把它作为产品的一部分就销售出去了,这是我们在企业转型方面考虑的一些因素。
  • 尹玉峰:作为制造业利润就是制造,真正的利润源泉还是在制造。
  • 主持人:三位老大已经讲了自己很苦的那一面,我们抛开这一面乌云总会散去的。刚才也讲到了很多的东西,大家讲技术讲创新,包括我们刚才有一些video也讲创新,所以有人会联想到一提到互联网会提到两个字就是技术,以技术为核心。但是就技术的发展理念而言,每个行业都是有不同的趋势的,例如说像淘宝或者是百度有可能大家想到的是以技术为王的公司,但是360周鸿祎一直强调的是产品为王,每家公司的理念还是不一样的。所以我想三位分享一下根据自己公司的情况技术创新能够给公司或者是行业带来哪些利益点?包括一些更尖锐的问题就是贵公司的核心技术的竞争力在哪儿?第三个问题,你跟你们的友商比较的话,你们强在哪里?
  • 贾志峰:这都是比较深刻的、刀刀见血的问题。第一,技术创新的利益点,我觉得我自己也跟我们的汽车之家的高管聊天,从他们身上我学到了很多东西,有一点讲的比较好的是互联网上争取一个能做到的是有和无的竞争,这个竞争可能是最容易赢的,如果只是一个80分和90分的竞争会特别难,而且大家会拼命地冲进来,把蓝海迅速地变成红海,在互联网包括在中国都特别常见,我们是“山寨之国”,经常山寨别人,腾讯也一直说一直在抄写从未被超越。那么什么是你有别人没有的,有跟没有这个趋势能保持多长时间,这个先得想清楚而不是先从技术端入手我能做什么,因为你做出来很可能有一个更大的巨无霸马上也冲进来做,基本上就变成了探路,探路之后基本上死得很惨,我们先从有无开始,汽车之家也不是一个平台级的公司,只是垂直行业目前做得比较不错的公司,这样的选择对有限的资源是比较安全的。汽车之家如果做微博我们可能会做出来,但也没有用。
  • 贾志峰:第二个问题,我不觉得技术能变成核心竞争力,淘宝不是今天就变成了淘宝,它是有巨大的平台支撑着。我觉得一个好的技术能引领公司的业务方向而不是说特别超前,但绝对不能拉后腿,这是一个互联网公司的技术部门来做的事。汽车之家的核心竞争力主要是在于我们始终是以用户为导向的,这一点不仅是贯穿在我们的内容部门,在技术部门也是秉承了这个理念,我们的中心思想是如何来满足用户,就是选择方向和做取舍也都是基本上按照以用户为中心的导向来思考的。这样做可以跟用户走得更近,满足用户需求这样技术才有生命,如果只是做技术很可能技术就变成了没有源头的东西。
  • 赵红武:这个问题确实也很难回答,我把你这三个问题融合在一起回答算了。技术创新确实是所有企业永恒的主题一直在谈创新,我们也一直在谈创新。像我们现在西电的水平从主业来讲,我们的技术水平好多是处于国内领先的,另外有一些技术是国际先进还有个别技术是国际领先。从主业的技术角度来讲已经达到了非常好的地步。上一次工程院的周济元涨到我们西电调研有一个中国制造2020的强国战略,就谈到了你们现在都认为你们的技术是很好的,好多都是国内领先还有一部分是国际领先的,我们大部分技术是国际先进说你们还需要做哪些创新?我们当时讲了一个很严峻的问题,我们中国人做的东西不落后,但是我们是靠人控制的,我造一台设备给你ABB对标企业,国内是处于绝对的优势,我们跟ABB的差距在什么地方?如果两家各造一台产品PK,我们赢的可能性会比较大,我们PK是做实验加电高压看谁的设备能通过,我们的参数会好一些。但是要同时造100台,ABB也造100台,ABB是99台没有问题,而你可能是50台没有问题。这是我们的产品可靠性的问题,我们是靠人控制,他们是靠流程制度和体系控制的。我们的技术创新该怎么走?我们应该叫产品可靠性,要提高可靠性,就跟国外的差距不大了。这个可靠性怎么来保证?是通过IT技术和信息技术。国家提出来“两化”融合,信息化和工业化融合,我们企业是非常典型的。“两化”融合其中管理信息化就不说了,数字化制造这一块,你能不能保证你的生产制造过程是数字化的过程,把信息技术用起来。现在所采用的数字化的一些制造过程包括所上的一些系统像MES、DCS,把生产环节每一道工序的质量和进度控制,可以跟产品质量联动起来,和前期的原材料的采购联动起来。所以这个环节上,制造过程完全可控,首先实现了数字化制造,以后要实现智能化制造,虽然我们目前是初步阶段先是数字化,但是要通过IT技术来实现它。另外我们产品本身的智能化,原来传统的产品是没有数字化接口的,我想知道产品是什么样子完全不一样,我们设备一坏就是大面积停电,可能是1/4的北京城没有电的非常严重的故障。如果设备出现严重故障的时候是来不及挽回的,这需要我们的设备提供智能化的接口。我们有一个状态曲线,这是这样一个形状,实验的时候设计理论是这样一个曲线,实际运行的时候这个曲线可能有偏差,时间越长偏差越大,假如说十年以后偏差就非常大了,这个设备要更换,不更换就会大面积停电。可有时候20年还没有问题,环境比较好,这时候根本发现不了,20年我们产品运行的状况是什么样的,说不定我们的设备还可以用呢。这时候如果把信息化融到里面去,这是“两化”融合的发力点。
  • 赵红武:另外,我们从“两化”融合来提升企业的技术可靠性,另外从服务来讲,现在大家都讲远程服务,我们现在也在做客服中心跟产品的GPS和检测诊断,包括前段时间提出来做移动应用,我的产品远程诊断的时候在现场要拿手机,我们工程师在什么地方,拿手机现场一照,远程设备安装的指令都可以通过手机发送过去,就可以接触到。我们的销售人员在外地手机上安装企业APP,销售人员跑到全国各地知道你在什么地方,你的售后服务工程师知道你在什么地方,什么地方客户有问题马上就可以定位出来这个工程师在附近。现在国家对一些传统行业还有通过“两化”融合的要求,让我们通过信息技术来提升核心产品竞争力,尤其是中国好多大装备制造的技术是非常先进的,可是可靠性、智能化是存在一些问题的。不像国外的量产流程是非常好的,所以“两化”融合是非常好的一个思路。
  • 尹玉峰:就像火箭和飞机的关系,造火箭没有问题是一次性的,造飞机就要求高一些了。这几个问题我也合成一个来讲,我先说不同点,戴尔本身是制造业,同时又是信息产业的制造业,所以从创新的角度和变革的角度确实也难一些,因为制造业的角度非常成熟,有几百年的历史了。有一些巨头已经在圈子里把规则定义好了,非常难以突破因为非常成熟。又回到信息产业本身又是发展特别快速,又存在着有和无的问题,又容易被山寨的问题,又容易被克隆,要在这个领域里变革和创新非常艰难。总结一下戴尔有三个方面的创新,以及这三个方面给业界带来了收益点。一个是制造业、供应链,这还是最核心的地方,也是利润真正的源泉。第二点是直接模式,可以用另外一句话来说,是以客户为中心,现在几个坐在这儿说以客户为中心,但真正在企业运营的各个角度各个环节,从制造、服务、人力资源、财务甚至是电子商务每个角度都能够以客户为中心,是需要非常严格的流程战略来指导控制的。第三点是拥抱互联网。亚马逊真正崛起是在互联网泡沫破裂的时候,但是在亚马逊崛起之前,十几年的时间全球电商排名戴尔一直是第一位的,并且是单一品类就是PC,这是最早拥抱电商的,也是全球第一家开放邮件卖电脑的公司,我刚才讲到大数据的应用也是通过大数据挖掘,也是到目前为止通过社交媒体结合大数据营销最高的。给我们业界带来的收益点是什么呢?这几个独特的优势带来的收益点就是业界第一次把大型存储1GB一美元,第一次带到了这个水平。网络是每端口多少美元也是最早带到这个水平,计算资源也是一样的,每个美元能获得多少赫兹的服务器的、PC计算资源也是同样的结果,所以说企业的创新和变革不仅仅是带给自己的收益,更重要的是对整个业界的发展和推动起到推动和帮助的作用。
  • 主持人:戴尔如何评价另外两家友商。
  • 尹玉峰:我特别喜欢讲这样的问题,是不是要我们的客户先评价一下?
  • 贾志峰:击鼓传花啊。我用一句话来回答,我们没有用过其他友商的产品,我们只有用过戴尔的产品。
  • 赵红武:戴尔产品在我们集团用得非常多,我们集团总部指定用戴尔的。
  • 尹玉峰:谢谢两位尊贵的客户。既然评价我们小圈子就直说了,PC产业非常非常重要的一个环节是制造,我们一直在强调制造,赵总也特别强调利润源泉是在制造,制造业成熟度非常高,但是依然有非常大的创新空间。这三大里面实际上有一家在制造业里面已经退掉了就是IBM,PC制造业和服务器制造业以及储存制造将陆续退出领域,并不是产品不好重要的是产业链的控制、制造业供应链的管理跟不上业界的发展,所以才陆陆续续地推出,如果这方面有非常好的管控依然能够保持非常好的利润,依然能够成为咨询软件都是高利润的产业里面依然能够保持非常好的利润是不会被卖掉的,这方面是没有跟上业界的发展。说到另外一个兄弟友时候是难兄难弟就是惠普,这是一个非常令人敬佩的对手,坦白讲确实是这样的,也是百年企业,发展也非常好,产品方面迄今为止也非常优秀,但是我们不同点在哪里?我们之所以只用了20几年的时间就取得了这么大的进步,是是否是以客户为中心,我们的直接模式。通过传统行业在渠道创新方面还是用了传统的方式一级二级三级,接触客户困难距离远而戴尔是最直接地接触用户通过很多种手段,第一,全球最先进的呼叫中心是在戴尔,直接接触用户,如果我们有机会的话可以去参观一下呼叫中心,它的业务流程管理销售行为管理、售后支持服务的流程管理都是非常领先的。第二,最早拥抱互联网电商,如果现在看全球电商排名还看不到惠普的位置,戴尔依然是排名非常高。第三是直接模式,怎样直接和用户接触而不是刻意远离用户通过更多的中间环节,制造业以客户为中心,以及拥抱互联网是我们和另外两个令人尊敬的巨头之间最大的不同。谢谢!
  • 主持人:评价竞争对手还是比较客气的,我觉得戴尔还是比较有高度的。接下来还有几轮的问题有可能有一些分组聊一下,首先我想请问戴尔和汽车之家,从PIT行业的角度来分析,汽车之家和戴尔会有很多共同之处都是从服务大众到细化市场来保持增长业务的。我想请问两家公司的业务模式的转变给IT技术带来多少压力?就目前为止是否存在着技术的壁垒问题?
  • 贾志峰:问题是很大的问题,因为用户的需求在变,场景在变压力是非常大的。像移动端汽车之家过去基本上是PC网站成长起来的公司,我们移动端技术的积累和PC端相比是不够的,我们在做一件事是想让用户通过移动上的App能直接地向经销商询价,里面类似于微信这么一个垂直的产品。这方面我觉得是一个汽车之家过去没有做过的事情,对我们的挑战就非常大,这是一个简单的例子。从宏观来讲因为我们用户的需求在变,场景在变我们也在不断地碰到技术上的挑战,所以谨慎地选择自己的公司的突破方向是至关重要的事,有可能你做你自己不擅长的事反而对用户的体验是有伤害。
  • 尹玉峰:挺满回答的,我先揭短一下,戴尔的系统几乎都是Windows的,作为全球前五大电子商务平台或者说互联网网站全Windows平台。有时候容易在这个角度受到一些我们是基于当代的体系建设的,但全球前几大互联网系统里面还是有一定的比例使用这个技术。说到技术创新IT技术或者是业务,我们现在越来越多是通过互联网销售通过直接模式反映给后台IT的压力是什么?是要快速做决策,我们经常价格变化很频繁的内存还有硬盘怎样能够根据客户的订购比如说同样需要16G,是四条4G还是两条8G还是单条16G,同样需要一定程度的硬盘,是SAS还是其他的怎样根据用户的选择趋势来快速的调整库存、采购和价格,让用户一方面能够以最优的方式、最低廉的成本满足需求,需要通过供应链的角度实时地分析,从通过后端供应链的优化提供最优秀的价格和产品组合是我们遇到非常大的挑战,我们后端也在使用内计算。我们用的是SAP的内存计算技术,快速地相应用户的需求以及提供更好的价格的产品。
  • 主持人:接下来另外一个问题需要问站在集团公司高管的角度宏观看企业的发展,如何确保IT技术发展的策略与企业发展的战略相一致?这个话题非常大,首先IT要支持企业的战略,以前企业做了很多的规划,包括跟安永搞的战略规划,我们相应地制定了IT规划要通过IT规划来支持企业的发展规划通过IT规划我们当时也是考虑企业的战略目标,企业以后产品的发展方向,企业扩张并购等方向,其实我们信息化方面有这样一个架构的思考,如果是集团型企业肯定有集团管控信息系统,子企业层面有子企业生产运营架构系统。这是两层结构,分二三四级企业,子企业生产运营的系统,对大系统来讲非常需要信息系统的支撑,我们看不到一些搞IT的公司能提供这样的支撑包括SAP和Oracle。如何能在集团层面为集团所管控我们管人管财务管营销、审计和安全性的规划,管的大的一些东西,这些东西在集团层面上用什么样的信息系统来管,它跟企业的各个系统是什么关系,这些研究我觉得是非常缺少的,所以在集团企业搞的时候集团层出现这样的困惑,其中有管财务的70多家资企业人类资源都有。在子企业层面我们核心是制造,ERP系统还有PDM系统还有目前正在推的MES系统,可以把企业内部从订单到发运服务整个过程管起来,这样的系统如何打通和利用起来?西电作为传统的装备制造业是很复杂的企业,制造过程是非常复杂的,截止到现在我就想我一直在考察真正能支撑其实我们IT支撑企业的战略其实首先我们要制定企业的IT发展战略,大概五年一个战略规划,其次我们在落地的时候要通过哪些系统来支撑企业的战略,资企业要怎么搞IT系统能不能支撑到位我们一直在研究,这就是西电集团的管理模式。
  • 贾志峰:对于IT如何支持公司的企业战略,汽车之家一般是通过对内和对外两个层面在看这个事对内我们有高管的业务 战略会,我们会想自己的业务线未来的一到五年会做到什么样的,经过几轮的头脑风暴技术方面相配套的体系,我们基本上把跟基础相对应的划出来,每个季度会回来对这个路线图进行反思和总结,根据当时的情况再进行调整,对外我们会作为技术部门肯定是密切地关注行业里面互联网企业里面所发生的一些新的技术突破和革新,上一个问题是问对友商的评价,我是没有回答这个问题原因是因为互联网变化的确太快了,我根本不知道自己的友商究竟会是谁。比如说做了双十一做完了左后也许明年天猫会做双十一我们的友商就变成了天猫了。我们过去是以文字和图片的方式在网站上呈现内容,如果做视频也许我们的友商就是优酷,我们过去在PC上做事,未来我们可能会做App,我的友商有可能是微信这样实时交互的工具。所以互联网你随时会成为别人的友商,我们会相应地调整战略。
  • 尹玉峰:您的集团管控放在了什么部门?
  • 赵红武:对我们来说集团管控分很多的管理体系,比如说科技发展规划、财务、信息化也是一条线每条线是你要管什么管到那个层级上,子企业干什么你干什么。
  • 主持人:由于时间的关系,本次的刀刀见血的聊天环节告一段落,我们最后一个环节是分组讨论,大家可以看一下旁边有几个黑板,那个是云计算的,这个是大数据,第三组是BYOD的移动讨论,大家是用30分钟的头脑风暴的讨论有关于三个主题,大家可以分享一下自己公司里面遇到的一些情况,看看其他的友商或者是兄弟公司有没有相应的解决方案,有很多的想法和好的建议,大家都可以随便地聊。我们在桌子上看到了一些小卡片,大家也可以随手写下今天会议的心得体会留做分享。今天感谢IT168的几位美女和帅哥,白富美和高富帅,演讲的平分内容为30分,评分的专家由两位峰哥和赵总担任,每小组30分钟之后由代表来分享大家讨论之后的心得体会。另外还有一个是微博活跃度的数量,这个跟汽车之家的老板李想前两天做赢在中国的时候做的汽车儿童安全座椅一样,有很多的转发量。我们可以关注微博轻盈IT,可以写一下自己的想法以及三个主题加上汽车之家主张加上三个主题加上你的观点。最后我们有一个抽奖环节,我们的活动开始。
  • 主持人:我们先有请三位专家就坐。我们可以像德云社一样欢迎一下他,并请童老师分享之后多拍砖。
  • 童剑:我跟大家分享一下我们小组讨论的观点,首先这个议题是云计算优化IT,所以我们主要说的是整个IT环境里头重点强调的是优化,到底是有一些什么样的优化或者说能用什么样的好处,我会先说这是我们第一个观点。另外一个方面是问题,我们在用这个云计算的时候,可能同样会给企业带来一些问题。优化的好处有这么几点:
  • 童剑:第一,成本方面的。有两种典型的环境,一种是创业公司,一个小团队可能没有太多的技术力量,更多聚焦是产品和业务快速地推出来,所以在这个环境里希望有便捷的云服务能快速地把技术实现了。所以就需求来说用了云服务有成本和效率方面的好处。另外,从大的IT企业来说可能很多的部门或者说有很多的计算机相关的软件的产品,在不同的部门产品在上线的时候会需要不同的IT和软件硬件的资源,如果说用了云计算的技术,这些技术能统一地调度,带来利用率的提升,这是成本角度看到的好处。
  • 童剑:第二,安全性。因为如果我们是没有一个统一的IT技术环境的话,可能不同的团队不同的部门、不同的人做事情的时候有不一样的习惯和方法,这样可能有的人能力更高一些,有的人可能经验能力更低一些,他们在部署一个IT或者是网站环境的时候对安全的把握是不一样的。如果说用了云计算有一些基础设施是统一的,只要按照我的标准来用,所以从基础来说或者说天然能够解决一些安全性的问题,包括有一些统一的管理规范、统一的专业的人员做这样的事情,都能带来安全性的好处,可能说数据安全或者说整个网站的信息安全(都会得到保障)。
  • 童剑:第三,效率(的提升)。很多网站都应该经历过这样的过程,公司在发展的过程中不断地推出新产品,产品推出的过程就是要搭建一个环境,比如说数据库的环境或者是存储的环境,总归有时候是不能复用的,开发人员不愿意做这样的事情,他先对付一下跑起来就OK了,上线了以后就管别的事情,继续做的就不去做了,所以如果有一个统一的云计算的环境可以看到大家有更专业的分工,开发人员更专注于做自己的开发或者是业务相关的事情,做云计算基础的设施的团队可能更多是专注于怎么把云计算这个平台搭得更好一些,所以说形成了人员分工重复的事情就不用去做了,所以看到了人员效率的提升。
  • 童剑:第四,标准化。因为很多云计算在搭基础的过程中应该说会有很多约束和应用的要求,在用这些云计算环境的时候必须得按照既定的要求或者是约束,比如说像这种类似于PaaS这样的平台就会有很多的约束,类似于Google的App、新浪的App,你有什么样的资源如果说被禁止的、不安全就不允许去用。基础上来说应该说是形成了合理的或者是经验积累出来的标准,避免不同能力范围的人有随意性和滥用的行为。所以,从优化的角度来说可以看到一些好处。我们在用云计算的时候其实也会有一些问题,比方说资源怎么样更合理地控制,因为像类似于不管是IaaS、或者是PaaS,很多的应用跑在公用平台上会形成资源的相互抢占,业务量大的应用一下子把很多资源都用光了,或者说某一个应用今天做一个什么样的活动或者是新产品上线或者是推广,可能一下子会让整个资源吃掉一大半,别的应用会受影响,这是在用云计算的时候怎么样做好资源的控制和隔离。另外也有人担心我在用公有云的时候会有安全性的问题,把数据和应用托管在公有云的服务商那,我怎么知道他会不会看我的数据,我的商业机密可能会泄漏的。这可能也是我们会比较担心的问题。另外在私有云的环境里,也有用户会担心说我会不会行业的趋势误导了,为了云而云,做了一些反倒成效并不是很好的事情,搜狐的张曙光应该也有一些实际的经验,不知道你想不想在这儿分享一下?我就把他说的再跟大家分享一下,在用存储虚拟化或者是计算类型的时候,我们有时候是有性能的要求,我们提供云计算的环境,搭一个存储平台很多的都来用了,搭的过程中很多的性能跟不上,很多的应用会出问题,这样引发的问题最后会变成云计算团队的工作上的挑战,比如说怎么解决这些问题,为了解决这些问题要花钱买更高性能的硬件或者用一些更新的技术,像内存Flash这样的技术来优化这个问题。不一定是一个不好的方法,但确实是看应用的场景。总体来说关于云计算的优化IT,应该说技术肯定是好的,我们可能重点要去关注的是是什么样的企业,是处在什么样的发展的阶段。我们要结合这个来看怎么样更好地应用这样的一个技术。这是我们的总结。
  • 主持人:下面是专家点评环节。
  • 赵红武:其实我觉得云计算探索得非常好,云计算也是我们企业在考虑的一些应用的方向,我其实很早以前是搞软件技术的,我们有一个理念叫做软件即服务,也就是现在的SaaS,当年也没有提高到云计算这么高的高度,可是当年很多的软件都是基于服务来做的,我在企业里也在推动云的落地,我很少提云计算跟大数据,我非常赞同专家所说的不说大数据,我当时跟企业搞IT的人员说我们要落地,我们要把云计算在企业里落地高,我们西电建立了自己的容灾的云,不用再投资了,只需要购买一两件lessons,可以在系统上给每家子企业分配容灾的空间,可以自己相对独立地操作,集团总部可以在全局范围内管控,按照一定的策略。包括CRM还有ERP,包括SAP和Oracle在说云计算,但对大企业来讲私有云建得比较多也是考虑到安全性的问题。安全性有时候理论上能解决,但没有一个第三方认证机构说这个是安全的,像国家的等保(音)得有一个机构说这个没有问题,我知道它本身问题也不大,但我要用的话必须要有人说这句话。第三方认证没有问题了,我们就可以用了。所以企业考虑建私有云可是理念非常好,探索了一些思路和经验,企业在搞信息化的时候是可以一步一步落地的,包括我们建的电子采购平台,我们建的系统里面也有淘宝一样的采购超市,所有的供应商都可以上来报价我们探索了很多云计算方面的数据。
  • 主持人:从侧面也了解到几个事,第一我要用公有云平台得有人来认证,国家药检总局也可以做这件事情。第二,我们现在也了解到国企很低调,所以我们希望下一次聊天的聚会也可以走进国企,了解国企IT信息化的优势,给我们提供一些想法。
  • 全国医疗卫生培训管理中心:我们组今天讨论的是BYOD的问题,我们讨论的可以说有两个大的内容,一个是相当于在企业信息化过程中产生的一些问题,还有关于移动互联网的头脑风暴的互动。
  • 全国医疗卫生培训管理中心:第一,关于在企业信息化过程中以及BYOD带来的冲击,因为BYOD的产品相关的设备进入可能会给我们带来两个方面的变化,一个是会给我们的效率或者是员工的方便性带来问题,但这里会带来另外一个问题,数据本身的安全性。我们组在讨论的过程中有很多实际的例子,比如说如果有认证机构可能会更放心地去用,我们中石化在建设信息化的过程中有很多加油站成千上万,原来都不是自己的而是收购来的,具体的数据是怎么上来的?包括原有十几年前相关的网络信息部发达怎么获得的?通过卫星甚至是通过无线发射器来搞定现在是通过手机。在建设的过程中如何注意保护企业的安全,我们讨论的观点是需要有制度的保障。比如说我们用的移动终端这个设备上全部都是公司的信息和数据吗?有没有个人的东西在里面?如果混有个人的信息怎么确认不把企业的东西带出去?中石化的做法是完全分开,企业就是配备相关的移动终端和笔记本,我认定你就是企业的东西,不管你怎么想,公司的制度就是这样的,当然也根据每个企业发展的阶段不同和信息化发展的阶段不同,比如说有不适合现在做的可能就是混杂一些个人和企业的信息或者是设备,这种状况可能是需要靠一些认为的。我们总结的是,没有一个信息化是完全靠IT手段的必须要辅助相关的制度、流程来约束和管制。
  • 全国医疗卫生培训管理中心:另外,我们讨论的是关于新的互联网应用的探索。大家头脑风暴产生的两个方面的思想,第一,现在微信或者说陌陌这些东西是针对个人端的,有没有针对企业的应用,可能会有利于这样的产品在企业中推动,也有利于企业信息化和企业本身管理方面的便利。第二,每一个行业都是有区别的,在移动信息化的过程中,如何结合本行业的业务做一些适合我们行业的应用,这可能是另外一方面的给厂商的引发点。这是我们讨论的内容。
  • 主持人:今天还有一个环节将会选出今天晚上的一组冠军获得大奖,奖品是什么?我不多说了,可能是一个比较丰厚的奖品,但拉票的环节是需要靠场外的支持的,因此请大家打开你的手机轻盈IT,编写一些下面的话。
  • 贾志峰:移动互联网现在是很热的热点,和互联网的趋势是类似的,都是首先从用户端出发,像是B2C的市场比较火爆,移动互联网目前也是这样,大家基本上都是在做B2C的市场。但未来的发展趋势是B2C向B2B发展。包括移动安全和企业信息,这一类应该是非常有创业机会的,如果要创业的话其实也可以关注这个领域。
  • 主持人:提到创业有多少人想过创业?(天天都在想),想创业找创新工厂,我前两天到创新工厂,我接触了七个团队,每个团队忘我的激情是非常感动人的,而且这些人基本上是85后的小孩,对我来说他们非常地年轻,给我注入了非常多新鲜的血液,并给我的脑子里充入了很多的好的想法,有机会IT168可以跟创新工厂合作,多聊一聊,也可以帮我们的一些小团队做一些推广。
  • 沈威:刚刚听了其他两组同学的精彩发言,我其实挺遗憾的虚拟化和移动的相关技术我们都想参与,我们这组讨论形式也比较特殊,大家非常积极踊跃一直在说,最后发现问题没有记下来,我少介绍一下我们组的组委会的会员单位,贾总不用说了,之后还有新浪的同学,还有我们公司人比较多,说着说着都是我们的问题,贾总所有的问题都可以跟着参与,所以没有记下来明确的条目。在Hadoop应用从无到有从小到大,目前到了一定的规模和稳定期之后还会有发展。基本上我们是用数据库来做,也用了列式数据库,前几年逐渐地发现,无论是存储的数据量的总量,我们的历史数据除了最重要的在线人数,我们会留一些备份出的离线数据。第二是运算能力,一直夜里12点的备份的同事做运算,10年我们性能比较高的已经排到第二天的8点了。去年年中贾总上改进版的时候我也探讨过,我们那时候刚刚上线,之后Hadoop在一个很小的范围内开始上了,上了之后大在年底的时候达到了10T到20T之间,现在有五六十个节点,现在每天的数据是在1T左右,在这个过程中有很多的问题,Hadoop技术不是问题,这是三四年前的技术,但这个面对应用的需求场景能够驾驭它以及从中获益的过程纯粹是一个经验的积累。
  • 沈威:第一,Hadoop集群的稳定性,因为我们公司比较特殊上的时候上了大概全部我们凑到8T,加上16个32G的内存,这样形成了一个节点,但节点不稳定,平均五六十个节点一周平均要坏三四块盘,我们的数据从来不丢,但带来的是运算节点的欠缺,比如说同时坏两个机器,夜里不处理了,上班之后一处理花两个小时,当天的数据要延迟产生,必须要在设备上增加投入,但Hadoop技术的安全性是有的。
  • 沈威:第二,我们感觉作为一个BI的概念里,实时表跟维度表,当遇到但维度表要更新的时候,3到4亿条的数据,每天更新几百万,ADFS(音)不支持我们更新数据,大致是一个数据集最后形成一个文件导入一个,这个效率非常低。现在也能做,但应该找找比较好的方法。我也在思考一个问题,比如说像我们最大的银行工商银行,他们肯定有几亿的数据加上死数据,他一般肯定是在用Oracle的数据库存放最核心的数据,当然有很多很高级别的硬件还有一些软件的配套,但这个数据作为一个维度表怎么更新的?每天肯定有很多数据要跟他PK,所以这也是一个比较大的问题。贾总带来的思路是Hadoop2.0之后这块有比较好的改变。
  • 沈威:第三,Hadoop的安全性,这个可以像一个数据库的操作,但这是非常典型的SQL的性质,而且Hyper的实质就是封装了Miscovideos,它的坏处是牺牲了效率,同时带来了一个问题是安全性,不像任何数据库有非常严格的权限控制。ADFS可以在系统一级做所有的事,当一个大的数据集群里面存储了一些敏感的信息,或者是重要的信息抛开这些不说,哪怕把数据删了这没有办法,HBFS保证的是节点的可靠性,一个文件三份有超过五个以上的节点我们认为大概就是安全的,一个节点12块硬盘数据花时间重新来恢复,但不会丢。但解决不了一个问题,您亲自进去不小心金手指把数据删了,鬼都搞不回来。不知道大家在权限这块怎么做,这带来了一个问题是对Hadoop集群的备份。真有人删了数据怎么办?这个问题我们大致解决了一下,因为中间我们丢过一次数据,是因为namenode节点没有弄好,我们把最核心的数据备份了一下这也是一个问题。但权限是一个大问题。这个好像在hyper的后续版本会有一些。比较好的是我们做一个二次开发,把权限从OS这级转化为WEB,估计权限控制可以解决这个问题。
  • 沈威:第四,实时查询的问题,有两个方面。第一个方面我们实时把库里面产生的数据都尽快地算一下。第二,已经在Hadoop集群里的数据怎么在最快的时间内把它取出来。第一个问题可能都是贾总给的非常好的思路是stop,常规的做法是快速地做Hadoop和读取,可是延迟肯定是更长。Hadoop非常适合统计的云,500页出来的数据是游戏里面的充值消费、等级分布,每天的登录还有留存都是预计好的一个程序,把盘数写好了结果就出来了。但另一个场景,当你大量的日志型数据或者是记录型数据已经在库里了,这时候不知道我的结果是什么?可能用户自动调了一个东西要看两年前的充值记录,我要什么都不知道了。这种环境不会事先预设好了,实时在数据库里查这个东西,而且要实时返回都是一个大的问题。别看Hadoop运算能力很强,但做这块事情必定是影响了其他的运行,这种要想别的思路。第二块预热要一段时间,这样才能把结果算出来,快一点的很快算出来,慢一点的是几十秒和几十分钟。如果我们有一个用户要调实时数据,等一两秒钟马上出来,这个实时数据的产出也是困扰我们的话题。我们现在的思路是用HBase,但它有局限性,对数据列的设计,我感觉Hbase的设计有点类似于创建一个表的联合索引,联合索引怎么建、表结构怎么建是一个挺结构的事情,它产出的结构的数据不可以随意地做,我们得到的信息也是Hadoop2.0会对这个有一个支持。说了很多都是我们比较关心的话题,这几个话题讨论也还不错。
  • 沈威:除此之外我个人总结在讨论几个问题的时候引申出几个挺好的思路。
  • 沈威:第一,我们现在的队伍人非常地少,其实专职做Hadoop的是系统的运维人员,周边还有四五个开发和做运维的人员兼顾地维护系统,但专职的人员非常少,投入是一个很大的问题。可能很多CTO、CIO都想做这一块,因为Hadoop带来的是企业的战略眼光,今后的大数据是企业一笔巨大的财富,你掌握了数据就掌握了主动权,你接近了用户的需求,你对没有需求的企业相比就占据了市场的先机,没有储备不会一步登天的。现在的条件下应该尽量地切入大数据,哪个企业都有大数据,我没有游戏业务,公司内部的OA平台也需要数据的融合,把地面推广和市场的数据产品数据都融合起来。怎么切入?也要感谢贾总提了一个特别好的思路。像我们现在用二手的服务器人员也很少,是因为我们产生不了利润和价格,所以这个事情要反过来驱动,我们的数据广告数据广告的精准投放,跟没有广告数据就不一样,而有精准的投放跟竞争对手相比占据了先机。从这个需求开始讲,这样可以预估出市场,预估出后面的利润、后面的增长,一个巨大的利益摆在这儿的话,很好解决投入的问题。现在我们两个Hadoop团队环境是巨大的差异,我们回去好好地分析我们这么多的投入除了给运行方决策方提供一般的决策之外,通过什么能产生机制,比如说驱动销售上面的游戏的转化,比如说我们能够某一次促销让他们进行预冲值或者是提升我们的道具,或者我们作为一个平台是否能把这些数据转入到其他的应用,或者是其他门户提供游戏的接入。一旦有了有利益的数据的驱动,我想建设问题可能就解决了。这是一个比较好的总结。希望大家能够抛出一些话题或者是对刚才的问题进行深入的分析,给大家提供更多的信息。
  • 主持人:沈威聊得还是比较细致,把事情遇到的来龙去脉和遇到的问题都抛得比较多一些,这也是我们将来要做的事情,比如说Hadoop或者是大数据面临的问题,每家公司成长的过程中都面临着很多很多的问题,但大家把问题都拿出来做分享有可能会绕开弯路。同时你也谈到了两家Hadoop的团队希望共同成长手拉手心贴心,我祝福你们。
  • 童剑:其实在公司里或者是在企业里要摸索,因为有很多企业在用大数据的时候可能把这个数据做了很多的挖掘,可能有很多的结果性的数据都分析出来了,但可能怎么样把数据在商业化包装上,刚才下午汽车之家的贾总也讲到了他们在数据上形成了商业产品,其实这方面可能是很多企业现在还在摸索的一个过程。我觉得从技术本身来说,把它应用起来应该说是相对比较容易的,也是我们搞技术这些人是热衷于做的,可是真正的挑战是怎么把它列为更有价值的商业化的产品,这个是我对大数据的点评。
  • 主持人:我们看新浪的大数据给我们做其他方面的分享,把你们之前趟过的雷都亮出来,大家就可以节省一点时间。接下来还有一个小小的评分的环节。大家是为三个team的演讲者和演讲的内容做一个评分。对刚才每一个小组里做的技术分享做一个评分,从0到10建议大家不要打10,因为做技术是绝对做不到10分的。要不然先从云平台开始。
  • 尹玉峰:我们这组9分。
  • 贾志峰:我跟他保持一致。
  • 赵红武:9分。
  • 主持人:BYOD这一组。
  • 赵红武:9分。
  • 尹玉峰:9分。
  • 贾志峰:9分。
  • 主持人:天下太平一团和气。接下来看大数据。
  • 贾志峰:9分。
  • 赵红武:9分。
  • 尹玉峰:9.5分。
  • 主持人:我们行驶一下主持人的第二件法宝,如果是同意9.5的可以一起鼓掌,同意我们的大数据这一组拿到9.5的话,我们就全场的人为他们鼓掌。刚才为我们做分享的是哪一位。我们在这里给大家准备了非常丰厚的礼品。
  • 申安安:非常感谢戴尔提供的礼品。
  • 沈威:感谢汽车之家、感谢IT168、感谢BYOD、感谢我们的云计算,最后感谢大数据感谢戴尔,感谢CCTV。

汽车之家轻盈IT之旅
与数十位CIO、互联网行业达人展开讨论,现场4组话题讨论及模拟案例演练,由嘉宾至观众的实时交互,立体分享创新商业模式经验,实地感受汽车之家轻盈IT之旅。
轻盈IT大不同·汽车之家主张
轻盈商道
  • 汽车之家深刻理解互联网传播优势,牢牢把握“搜索与互动”这两个新媒体平台最突出的特色,立足于此为用户提供服务。是国内唯一做到“为每一款车型建立一个专属网站”的媒体。
  • 作为用户互动载体,坚持以产品为核心分众用户、聚众用户,拥有国内领先的垂直网络媒体互动人群。
  • 同时通过社区架构和管理的不断优化,以原创为主,更令这一庞大人群有着领先的用户粘度和优质属性。
汽车之家简介

汽车之家是全球访问量最大的汽车网站。为广大汽车消费者提供买车、用车、养车及与汽车生活相关的全程服务,以全面、专业、可信赖、高互动性的内容,多层次、多维度地影响最广泛的汽车消费者。根据iUserTracker数据统计,汽车之家月度覆盖人数接近8000万,中国互联网汽车用户60%的时间花费在车之家。

汽车之家是中国最具价值的互联网汽车营销平台,以全球化的视野和深刻的行业理解力,未来将持续推出创新的服务内容,并强化移动互联网等领域的各种应用,始终引领汽车互联网传媒的发展。

活动时间: 2013年11月14日 13:30-16:30
活动地址: 北京·丽亭华苑酒店
北京市海淀区知春路25号
贾志锋
贾志峰先生现任汽车之家副总裁。此前,贾志峰先生曾任艺龙高级总监,主要负责技术架构以及机票预订系统的研发工作;他还在思科公司担任网络管理及网络安全的软件架构师。
 
赵红武
中国西电集团变压器板块 CIO
多年装备制造业从业经验,对于制造业业务和IT融合有独到见解。组织实施中国西电多项大型IT项目建设。
 
乔杏刚
戴尔中国重点商用客户业务部
华北区销售总监
现任戴尔中国重点商用客户业务部华北区销售总监,他的工作重点是
在华北区六省两市的重点商用客户中积极推进戴尔产品的销售以及提升戴尔企业级解决方案的认知,同时推动消费和小企业业务市场份额持续增加。
尹玉峰
戴尔中国大兴商用客户业务部企业
解决方案资深经理