您的位置:主页 > 公告动态 > 期货市场 > 期货市场

一个冷门创业者的变热,一场数据变化的最先

2019 年 7 月,我见到了正准备创业的 TJ(唐建法)。TJ 那时是 MongoDB 大中华区的首席架构师,也是 MongoDB 中文社区的确立者,在业内拥有异常高的着名度和口碑,行业内有人称它为 MongoDB 的「最终玩家」。更早之前,他在美国联邦快递担任首席架构师。

不久后,TJ 脱离 MongoDB,确立实时数据平台 Tapdata,完成了从大平台高管到创业领域的「小人物」的转变。

TJ 曾经以为自己是一个善于表达,善于引发人人共识,能把庞大的产物手艺说清晰的一小我私人。然而,据我考察,创业之后,他反而在这方面遭遇了伟大的「心理挫折」。

很长一段时间,追求融资的历程中,投资人不明白 TJ 做的事情。一方面,Tapdata 做的是手艺领域异常「专精」、触及底层的产物,专业门槛高、明白起来不容易;另一方面,Tapdata 找不到外洋的对标产物。TJ 和我说:「有一次,一名投资人不停问我这个产物的外洋对标产物是什么,我说没有。由于真的没有。他不明白。」

但相比投资人的明白「滞后」,行业、市场对 TJ 做的事情的反映是迅速的。Tapdata 确立一年,团队也许 20 多人,第一年的营收却有快要万万,产物获得了诸多行业标杆客户的认可,包罗中国移动、中国一汽、周生生、TCL、南方电网、富邦银行等。

有了应用场景之后,投资人们终于明白 TJ 正在做的事情的合理性和价值。很快,2021 年中旬,他们先后拿到了五源资源、XVC、德联资源等机构数万万美元的 PreA 及 PreA 两轮融资。而外洋相似营业的公司,则在 Tapdata 降生一年后才泛起。

时代变了。中国新一代的手艺创业者,往往在事业劈头就具备国际视野,许多创新可以源自中国本土,而不是再模拟硅谷。

更深条理的,TJ 所做的事情从不被明白到被明白,Tapdata 这种新事物所向无敌的发展,也标志着对于数据这件事,「重新明白、更好运用」时代的最先。

01

所谓的「数据运用」新时代是什么?

凭证 IBM 调研,全天下 90% 的数据是在已往 2 年内发生的。整小我私人类商业天下在这两年里,履历了一次数据大发作,且这个历程是不能逆转的。未来,任何一家公司理论上都是一家软件公司,需要定制化的应用来支持营业。

已往,只有一些特定行业的大公司会提「数字化转型」,而现在,各行各业的数字化转型都在快速且自动地完成。好比,当各家公司最先上线新型 ERP、SCRM、IOT 以及低代码等系统的时刻,会建设越来越多配套的数据库。而差异数据库之间的数据往往是不相通的,处于一种数据孤岛的状态。

疫情这两年,尤其加速了这个历程——我们通过在线文档来协作,通过视频集会来取代线下的集会,以及将促销流动搬到线上等等。

线上谋划流动变多了之后,事务型系统(Online transaction processing,简称 OLTP 型营业)变得越来多和越来越主要。

什么是事务型系统?TJ 曾举过一个例子,好比说你开个奶茶店,最先的时刻你只需要用个 Excel 来治理一下天天的销售情形和成本支出等。厥后你越做越大,一家门店一天卖出几千杯,Excel 已经无法处置这么多的订单纪录,于是你可能会委托一家 IT 服务商帮你定制一个简朴的销售系统,用来纪录天天的销售情形。为了利便主顾手机下单,你又雇人开发一套小程序系统用来下单和送外卖。这些,都是事务型系统。

当你最先有了几十家门店的时刻,你可能会体贴哪家门店最赚钱?什么时间段生意最好?什么品类最好卖?要回覆这些问题,就需要对上面应用系统内已经发生的营业数据举行一些聚合剖析。由于做这些剖析需要的数据往往储存在差异时间构建的差异营业系统之内,以是我们需要将数据汇总到一其中央化的数据平台,好比说数据客栈或者大数据平台。这就是一个典型的剖析型营业(Online analytical processing,简称 OLAP 型营业)。

对于事务性系统的要求,正在变得越来越庞大,好比一家珠宝零售公司想要用数字化系统推动一个促销方案,这看起来是一件很简朴的事情。但现实上,它的实现是异常难题的——要明白这件事,我们得先简朴聚焦一下「数据孤岛」。

已往几十年里,降生了林林总总的数据库,针对差其余营业系统,一家公司使用的配套数据库可能也并不相同,数据库结构各不相同,使得差异系统发生的数据无法被快捷地以特定目的来集成和挪用,便形成了「数据孤岛」。

数据孤岛问题早已存在,Tapdata 也不是第一家试图解决数据孤岛的公司。大多数解决方案是将数据中央化,定期批量抽取营业系统数据,放到中央化的,以 HDFS (HDFS,指 Hadoop 漫衍式文件系统)为代表的大数据平台,完成数据的汇总,然后对抽过来的数据举行剖析。

但这种做法存在的问题是数据处置不实时,只能举行后台离线剖析,不能支持实时的营业场景。好比上面提到的珠宝公司搞促销流动这个场景,会涉及到支付、库存、产物价钱等信息,若是没有一套统一的系统可以实时、准确地获取和处置这些数据,那就无法为营业提供支持。

再好比,客户在一个已有的营业系统下了个订单,第二天这条订单和库存才气更新到其他对该客户数据感兴趣的下游。若是想开发一个小程序来治理客户在多个营业系统内的生意订单,就没法做到。这是许多传统企业数字化转型所面临的问题。

而想要解决这种问题,就需要一种更为实时的数据采集和获取方式,以及新型的数据库来存放、融合差异类型的数据,且能够做到高并发,毫秒级响应。而中台存储数据库,只有以 MongoDB、TiDB为首的漫衍式数据库才可以做到。这也是为何最近几年,数据领域发生了伟大转变——漫衍式数据库最先迅速崛起。

这不难明白:一方面,已往几十年的企业数字化造成了许多的孤岛系统和数据,而只有「融合」后的数据才气真正用起来,企业越来越需要打破「数据孤岛」;另一方面,随着 IT 架构的迭代升级和营业端的全渠道营销,企业对于数据的实时性要求越来越高。

自 2017 年上市,面向事务型营业(OLTP)的 MongoDB 的市值从 12 亿美元增进到现在的 284 亿美元。4 年多的时间,市值涨了 24 倍。市场已经为未来指明晰偏向:OLTP 型营业的价值正强势崛起。

然而,许多大企业经由 20 多年的信息化建设,已经存在大量的差其余数据库,他们很难马上甩掉掉这些稳固的,天天正在支持着营业慎密运行的数据库,并投入极高的成本迁徙到新的漫衍式数据库上。

但问题照样需要解决。面临已有的众多数据库,若何在一个平台上,解决差异数据源的数据实时提取和融合——这个摆在当下的、险些所有企业都面临的伟大的历史性的需求,便给了 Tapdata 这样的「新物种」时机。

02

在数据天下里,

修建「高速公路」

TJ 之前在北美留学、事情十余年,2014 年,加入了 MongoDB,并打造了 MongoDB 中文社区,通过大会、博客、文档翻译、免费社区手艺支持等方式,搭建起一个非盈利的手艺交流社区。

在 MongoDB 事情时代,TJ 的事情加倍靠近客户。他也因此很强烈地从客户侧感受到了,企业在数字化转型历程中遇到的前文所提到的数据问题。

一次,在 MongoDB 内部的黑客马拉松竞赛里,TJ 设计了一款 demo 来解决这个问题,虽然在决赛中 demo 由于手艺缘故原由没能运行乐成,但没想到受到公司销售和市场同事们的热捧获得了第一名。这也从侧面验证了市场的现实需求。

2019 年 9 月,TJ 从 MongoDB 告退,开办了 Tapdata。Tapdata 打造了一款名为 Tapdata Cloud 的免费开放版工具,能将差异系统中的差异类型数据实时同步到类似于 MongoDB 或 TiDB 等新一代漫衍式数据库上,来辅助企业随时睁开种种注重时效性的新营业,成为了海内实时 DaaS(Data as a service,数据即服务)赛道的开创者。

可以这样明白,企业原有的数据库继续使用,但 Tapdata 相当于给它们加了一层「插件」,相当于在两者之间搭建了跨系统的「高速公路」,且具有双向车道。以一种很轻盈的方式,解决了庞大的问题。

以某市教育局为例,在教育应用系统中,教研职员通常需要在 OA 办公,教科研,学天生绩、行为剖析、音视频资源等等一大堆应用中频仍切换。将 Tapdata 作为主数据平台后,可以让使用者一次登录即可接见所有教育系统内的应用,而且在一个应用中修改的数据会在所有的应用中获得更新。

另一个案例,以某头部奢侈品零售品牌为例,该客户在两岸四地有几百家门店,一年要举行大巨细小上万场市场流动,其中数百个流动需要 IT 部门支持,而 ERP 后台有数十人的香港团队认真。通常情形下,香港的手艺团队平均要花四到八个星期来支持数据挪用的诉求,因此经常处于交付高压状态下,无法实时响应前端团队的需求。

Taptada 改变了事情的整个流程,事先将企业多套 Oracle 营业系统的差异类型数据举行实时采集,同步到中台数据库。当一个新的营业需求进来时,操作职员在 Tapdata 里直接拖沓拽,就能搭建好需要的数据表模子。这个历程也许 1-2 个小时就能完成并进入测试环节,且做到了数据的实时更新。营业职员也不再需要等几个小时,甚至隔日才气看到流动日的各项订单等数据。

03

重新思索数据的意义

和 Tapdata 部门场景存在重合的 Fivetran 在 2020 下半年完成了 1 亿美元的 C 轮融资,估值 12 亿美元,提升为「独角兽」。

这个新闻传到海内,有投资人问 Tapdata 和 Fivetran 的差异,TJ 意识到,两者追求的大偏向是一致的,Tapdata 更像是 Fivetran 的「超集」。所谓超集,即 Fivetran 能做的,Tapdata 也能做,而 Fivetran 不能做的,Tapdata 也能做。

2021 年 9 月,Fivetran 完成 5.65 亿美元 D 轮融资,估值 56 亿美元。一年间估值翻了 5 倍。在融资后,Fivetran 收购了数据复制公司 HVR,最先发力实时数据服务能力,最终照样驶向了 Taptada 开拓的这条赛道。现在,海内外陆续地也有一些企业最先在这个领域「萌芽」,好比 2020 年,硅谷泛起了一家叫 Meroxa 的公司做跟 Tapdata 靠近的事情。

外洋终于有了知足投资人「对标」的企业和产物,也有了可以对标的创新价值,虽然 TJ 受了一年多不被认同的苦,但我以为最终也是「福报」。由于这证实晰 TJ 比别人先看到了趋势。而这个趋势不仅仅是数据运用到营业的「实时性」,更主要的是,今天这个时代,数据的接入权实在就代表着创新的气力,数字化就是要基于数据去做创新、做决议。

打个譬喻:随同着数据这个「油田」越来越大,早年间,每个家庭自己拎一桶,也就够家里的取暖和了。而现在,人们不仅想用石油来取暖和,还想用它举行工业化生产,甚至还要出口。这个时刻油田的管道等基础设施,就需要更新升级。从本质上讲,实时 DaaS 平台,就是为层出不穷的新需求打造的基础设施。

这一点上,我发现 Taptada 做的事情,在精神上实在是和飞书高度一致的。我们公司使用飞书,我也受邀到飞书内部做过许多次交流,

飞书主张的头脑就是在一个组织内,信息要充实透明和有用流动,这有助于每个个体施展更大的智慧、能量。以是飞书对于先进公司,是有异常强的吸引力的。

同样,Tapdata 让更多人可以更便携地接触更充实的营业数据,来实现商业创新。它不仅仅一个局部功效,它背后所代表的更是一种通向创新的文化。

TJ 有一个一直被人津津乐道的身份,前摇滚乐队键盘手。你可能想象不到,现在这位盘算机领域的能手,大学从数学专业结业后,在一个摇滚乐队当了四年全职键盘手。厥后,他才自学的编程。

键盘手在一只乐队里,往往能够拉高整体音色、气氛,又能够和成员顺滑地融合在一起。这种气质和他现在做的 Tapdata 还挺契合的,既兼容已往又通向更高的未来。

摇滚乐在降生之初,也代表着谁人时代思索的前沿。我印象里,搞摇滚的人若干都带有一些叛逆和前卫。这么看,摇滚乐键盘手,和现在数据领域创业者身份的转变,内核还挺一致的。