刘润:字节跳动“火山引擎”技术平台,助挖掘机实现“数字化”!
(注:火山引擎,是字节跳动公司推出面向企业的技术服务平台。2020年6月22日,火山引擎正式上线。)
这两年,大家都在提数字化,很多组织都有转型的需求。我也发现,有不少企业,想尽自己的经验和能力,更好地帮助这些组织实现数字化。
字节跳动,就是其中一家比较特别的公司。
我曾经说过,这是字节跳动的“能力溢出”。
你一定听说过他们对于OKR的理解,听说过“Context,not control”,听说过他们这几年的快速增长,也听说过他们强大的数据分析能力。
字节跳动,把对内为人称道的治理和管理能力,溢出为一个产品,叫飞书。把对外为人称道的增长和数据能力,溢出为一个企业级技术服务平台,叫火山引擎。
2C的能力,溢出到2B,服务更广阔的企业市场,并且和这些企业一起成长。
飞书,大家相对熟悉。火山引擎,可能你还没那么了解。因此,他们怎么用火山引擎,帮助企业更好地实现数字化,我一直挺感兴趣。
我一见到字节的同学,就请他们给我讲讲。字节的同学和我说,这样,我请我们的客户来,他们对于自己的变化,感受才是最明显的。然后,就帮我联系到了华兴研究院工业大数据研究所副所长,张佳。
2016年,国内工程机械龙头企业,三一重工,正式开始数字化转型之路。而上海华兴数字有限公司,就是三一重工成立的全资子公司,专门为三一重工打造数字化系统。
听完张总给我讲的数字化故事,我脑洞大开,也深受震撼。
我想,这对于关注数字化、想实现数字化的人来说,都会很有启发。
“从三个小时,到30分钟。”
一提到工程机械,大家可能就会想到挖掘机。一提到挖掘机,大家可能就会想到这是比较低水平的东西,也没什么技术含量。
但是张总和我说,今天可不是这样,现在的挖掘机,是非常高科技的东西。
挖掘机,都已经IOT(万物互联)了。我们在挖掘机上,安装了各种各样的传感器:前后泵主压传感器、转速传感器、前后泵电流传感器、先导压力传感器……
通过这些传感器实时传回来的数据,我们就能知道挖掘机的很多信息,比如它的地理位置、工作状态、工作档位,等等等等。
但是,知道了这些数据和信息,能有什么用呢?
张总和我说,能干特别多的事。
比如说:健康管理。
你看,在地图上,每一个点,都是一台挖掘机。我们能知道它在具体的哪条街道上工作。你点开放大来看,还能看见挖掘机的3D模型,看到它的核心部件。
如果有故障,就会马上变颜色提醒我们,要注意了。
挖掘机的“健康管理”
这样,发现一些小故障时,我们就可以立马进行检查,不会酿成大问题。
否则,等到真正的大问题产生时,那不仅仅是维修更换的成本很高,更重要的是,还会影响生产。耽误了生产,那就麻烦了。
而且,通过数据,我们也能分析,这个部件到底为什么会出差错,然后在下一次的研发中继续改进,进行迭代。
这就是数字化的力量。通过分析数据,我们能对挖掘机的健康状况实现提前预警,也能实现对未来的硬件优化。这些对生产,都会有巨大的帮助。
有意思。
但是,这些都是怎么实现的呢?肯定不是让工人一秒不差地天天盯着,也肯定不是让工人拿着纸笔一直在算吧。
张总说,就是通过IOT的数据。我们会进行数据建模,大量计算,用机器学习来发现一些特征。
比如说,一些设备的压力值,合理的情况下,到底应该在一个什么样的区间。如果超出了阈值,发生异常,可能会导致什么问题。
华兴组建了一支近300人的研发团队,占公司成员的90%以上。我们每天都在研究各种各样的算法,迭代不同的模型。
只有这样,才有办法准确预警,提前介入,进行优化。
但是,想要做到这些,听上去似乎很容易,实际上非常困难。
因为数据建模,算法训练,需要进行大量的计算,这对速度的要求就特别高。
你知道吗,我们每天传回来的数据,压缩之后,都还有100GB。再加上用于训练的历史数据,可能有几十上百个TB。数据太大,这对数据的读写和计算速度,都提出很高的要求。
过去,我们是用第三方的开源数据库,速度很慢。每天我们的算法训练要好几次,但是每次都得等好几个小时,特别影响效率。
没办法,只能换其他产品。在市场上看来看去,也试了几家,最后决定选择ByteHouse。
为什么?
因为ByteHouse,是火山引擎基于开源ClickHouse的企业级分析型数据库。历经字节跳动内部海量数据场景的打磨,和极限的业务要求,有这样子的能力,应该可以很好帮助到我们。
然后我们试了之后发现,通过ByteHouse,计算的节点确实更多,算力也大大增加,计算的速度也更快。
更快,那到底有多快呢?
亚秒级的读写速度。原来一次要三个小时的计算,现在30分钟就完成了。因此,我们的算法也得到了更多的训练。
就像一天只练1次的算法,和一天能练10次20次的算法,迭代速度和算法质量肯定是不一样的。
所以,我们才能更高效地实现挖掘机的健康管理。
这就是一种万物互联之后,带来的挖掘机数字化。
“从1万条/秒,到37万条/秒。”
但是,只分析历史数据,进行预诊断的健康管理,显然还是不够的。
在生产经营中,我们还是要看到更多的实时数据。
在这个仪表板(Dashboard)上,我们能看见一共有多少挖掘机,一共有多少工时等等信息,别小看这些简单的数字,这些数字非常重要。
这可是一种“挖掘机经济学”。
目前全球三一挖掘机总工时每天一百万时以上
判断经济发展,有很多的指标。但基础建设,一定是最重要的指标之一。
衡量基础建设的指标,一般有两个,电力指数,和挖掘机指数。就是一个地方到底发了多少电,和一个地方销售了几台挖掘机,有多少挖掘机在工作。
让更多挖掘机,能更好地工作,对经济建设就会有很大的帮助。
某时间段内江苏省各城市的平均工时,颜色越深,工时越高
而且,我们也能判断挖掘机的产能和使用效率,做市场分析。
比如说,假如常州和无锡的工时数量突然上涨,你知道这意味着什么吗?
这可能说明,这两个地方正在大力建设发展,对挖掘机有更多的需求。那就可以让我们的代理商去这些地区,提供针对性的销售和服务,避免影响到他们的生产。
你的挖掘机数量够用吗?现在手下的挖掘机,有几台工作年限已经很长了,每天还开工这么多工时,用不用重点关注他们的健康情况?有些部件,已经磨损得很严重了,你们考虑一下要不要换一批新的?
通过这样的方式,能帮助到这些地方更好地建设,对于我们有限的营销销售资源,也可以使用得更有效率。
但同样的,想要实时计算工时,也不是一件容易的事。
张总说,那可是海量的数据。我们有接近50万台挖掘机,开工旺季挖掘机每天产生的数据量超过5亿条,2021年挖掘机一共产生数据1429亿条。
而且,我们的挖掘机数量还在增加,数据量每年还会翻倍上升。
这么巨大的数据量,要支持存入很困难。原来的技术架构及数据库,写入速度只有1万条/秒。
1万条/秒,听起来好像很快,但我们发现,当同时工作的挖掘机差不多超过10万台时,就已经撑不住了。
然后,查询也变得很复杂。比如,针对查询某一天内每台挖掘机上传的工况数量场景,由于数据量太多,没办法一次性查询,只能按照100个机号一组,分批执行查询。这就需要大约10个小时,才能查完所有设备。
太久了。
我问张总,那你们用了ByteHouse之后呢?
他和我说,ByteHouse,可以支持存入更大的数据体量。现在的入库速度,是37万条/秒。也可以直接查询计算了。
这么说,可能还没什么概念。这样,说一组数字,你就更有体感:
想要计算全球所有三一挖掘机的总工时,接近50万台设备,单表数据量超过1500亿,每日新增超过5亿条数据,同时每秒超过1万条数据写入,计算时间是多少?
算一次,只要34毫秒。
这个效率提升,是巨大的。
能存入更大数据量,能计算更大数据量,效率就更高。因此,也就能对业务做更多探索和洞察。
而这些洞察,非常有趣,很有意思。
“两张报表。”
哦?比如说呢?
就举两个例子吧,比如说:两张报表。
提问:你知道,在各个不同的省份,挖掘机最常工作的档位是多少吗?
在这张报表上,你可以看到,比如在山东、安徽,经常使用6-8档位。而在内蒙、甘肃,经常使用9-11档位。
在各个区域的挖掘机,使用不同档位的区别
档位低一点,油耗就低一点,比较节油。档位高一点,效率也就更高。
但是为什么,像内蒙和甘肃这样的地方,就相对更注重效率呢?
这就是通过档位分析,可以得出来的洞察。
可能是因为在这两个省份,在进行大开发,在挖矿。
搞开发,搞挖矿,那是耽误不得的。时间就是生命,效率就是金钱,要抓紧拼命生产。
可是,得到了这个洞察,又能怎么样呢?
张总说,通过这个洞察,我们就有机会对不同地方的不同机器,进行针对性的调校。
就比如说要出厂到内蒙和甘肃的挖掘机,我们也可以通过调节发动机和主泵的功率匹配等等技术和方法,让挖掘机在高档位工作时,也做到尽量节油,提升它的油耗效率。
这就是基于数据,得到的洞察。基于洞察,反馈迭代到机器的改进。基于机器的改进,实现业务更好的发展。
再提问:你知道,在哪个省份,挖掘机的行走时间最短,工作的时间最长吗?
在这张报表上,你就可以看到,在新疆,挖掘机的“走挖比”最小。行走时间的比例很小,挖掘工作的比例很大。
在各个区域的挖掘机,行走比例的不同
那你从这里,又能洞察出什么?
你可以想象,也许是新疆那里都是很大的工地,工程量很大。所以挖掘机尽量不走动,一直进行工作,然后是卡车在动。
挖掘机一铲子下去,只要掉个头,旁边就是卡车,卸完之后马上又转身继续工作。这样,就不会影响效率。
而这个洞察,也是能反过来指导业务和生产的。
比如说,分析行走频度,能知道零部件在实际工况下的使用情况,帮助提高挖掘机的设计水平。
所以,就合理设计挖掘机的行走时间和寿命,进而降低成本,避免资源浪费。
这些,都是基于ByteHouse提供的能力。有了这些能力,才能支持更多的数据应用,洞察更多的业务场景。
什么是数字化?这就是数字化。
用数据,来分析、洞察、指导业务。
最后的话
这两年,数字化提的很多。但是,到底什么是数字化,如何实现数字化?
我曾经说过,数字化,其实就是在数据中提炼信息,在信息中找到知识,在知识中凝结智慧,用智慧来洞察业务。
我想,通过张总的分享,通过三一华兴的故事,你可能会有更多感受。
在任何时代,变化都发生在方方面面。数字化的要求,也发生在各行各业。即使是你可能未必关注的工程机械领域,在挖掘机身上,也是这样。
而在数字化需求的背后,同样需要数字化能力的支持。
字节跳动的火山引擎,把自己的能力溢出,更好地帮助其他企业。在企业底层的数据仓库,和上层的业务应用之间,成为了一个高效的数据桥梁,帮助企业能更好地查询和分析数据,洞察业务,也帮助企业实现降本增效。
感谢张总的分享。
也很高兴看见,字节跳动的火山引擎,能帮助企业更好地实现数字化,能和企业共同成长。
希望这篇文章,能让你对数字化有更多理解,对你有更多的启发。
我也祝你,能早日实现自己的数字化。
责任编辑:Yaodl
买车卖车 养车维修 疑难故障 学大招
扫码加群 BOSS团同行好友等你交流