新闻中心
官方数据:大数据骗局3.0: Hadoop已死
2022-07-14 19:51  浏览:187

随着大数据客户回避复杂技术并接受云计算,供应商步履蹒跚。

大数据还是很重要的,但是旧大数据时代的几个模型:,和MapR最近相继失传,让大数据行业有些冷落。曾经是数据世界的宠儿并能够筹集到大笔资金(英特尔在单轮融资中投资了 7. 66 亿美元!),这些巨头被迫缩减规模或合并(和),或裁员(MapR)。

在此期间,和其他开源大数据提供商一起飙升。这怎么可能?当然,原因有很多,其中之一是过去的供应商在错误的数据中心工程师身上押下大赌注,而市场已经转向寻求自由的开发人员。

大是相对的

MapR 是最先发家致富的供应商中受苦的。曾经估值超过 10 亿美元的 MapR 最近透露,它必须解雇 122 名员工(约占其员工总数的 25%),包括首席执行官约翰、其他高管和许多工程师,并关闭其总部,除非能找到合适的人选。投资者。

此投资者必须在 6 月 14 日之前注册,否则 MapR 的前景黯淡。

但是,近年来情况并没有好转。数据显示,过去两年,MapR的估值缩水了29%。巧合的是。刚刚报告了合并后的灾难性收益(可能是由于两家公司无法独立生存),预计收入将比分析师预期的少 6900 万至 8900 万美元。与此同时,CEO Tom 和首席安全官兼联合创始人 Mike Olson 均宣布辞职。

的股价暴跌 40%。

这样的结果更有可能归因于过度炒作的大数据空间回归现实,而其他供应商却蓬勃发展,尽管一些领导者步履蹒跚。比如数据库越来越火,现在和MySQL一样火爆(以各种排名衡量),形成三管齐下的趋势,而仅仅五年前它的市场份额还只有十分之一。反过来,这种受欢迎程度又推动了同名公司收入的迅猛增长,最近增长了 78%。

同样,分布式搜索和分析引擎背后的公司在去年将员工人数翻了一番,最近一个季度的收入增长了 70%。许多公司一直将它用于传统的文本搜索和其他任务,例如伦敦斯坦斯特德机场用来跟踪和显示通过机场的人流和行李流以提供实时分析的工具。

脚本不应该是这样的。按理说,He等技术及其背后的公司,从来没有挑战过他们的后继技术,但他们成功了。是什么原因?

预计云的情况会很好

嗯,云是一个原因,但它是许多事情的一部分。正如 Lodge 的高级副总裁所写,虽然 MapR 和 MapR 已经从本地产品中拼命发展,但来自 AWS、 Azure 和 的云原生选项共同提供“完全集成的产品,购买成本更低。,它更便宜规模化。”许多企业都注意到了这一点。同样,供应商也在尽可能快地构建云服务,但他们根本无法跟上他们的云竞争对手。

虽然当时是革命性的技术,但与云替代方案相比,继续享受云的好处的成本高得令人望而却步。正如克林特夏普所说,“主要用途一直是廉价存储。[鉴于云] 存储变得更便宜,加上 S3+ EMR 和其他服务的用户体验提高了 1,000 倍。”例如,虽然它可能是传统的专有数据仓库的绝佳替代品,但远不如基于云的这些更现代的方法。

与此同时,云预示着一种不同的新数据处理方式。云服务本身并不是对等的替代品,但它们处理的问题类型相同,或者以更简单的方式处理。正如 Joe 的 Joe 所说,“编写高效的分布式地图算法很难,真的很难。”更糟糕的是,供应商正在竞相将大量开源插件(!Pig!Hive!Flume!)添加到他们各自的产品中,开发出更笨拙的“解决方案堆栈”,直到最后“没人知道这些是什么”一位观察家表示,公司正在这样做。

对于负责“完成任务”的开发人员,他们越来越多地选择更简单的替代方案。

以方便为主

对于用户和后续技术,开箱即用的体验很差。形成鲜明的对比。前高管凯利将用户体验视为关键差异化因素。这怎么可能?汤姆解释说:

[如果使用],您可以在 apt 命令的帮助下轻松安装在服务器上,而无需摆弄糟糕的虚拟机即可开始使用。在生产环境中,您可以在单个服务器上运行它。您可以将它连接到一堆东西而无需编写一堆代码。人们想要数据库……很容易获取数据,也很容易转储数据。 "

DB 首席执行官 Ajay 表示同意大数据培训是骗局,并补充道:

深受开发者喜爱[是击败的理由]。 Mongo 专注于首次用户体验。众所周知,它很难运行。 [供应商] 在向企业推销宣传方面做得很好,但没有受到开发商的追捧,增长停滞,市场蒸发。

虽然说开发人员喜欢全面解释和比较 MapR 的成功有点夸张,但这是一个重要因素。

Jake 推断开发人员开始“嵌入”他们的现代应用程序。随着时间的推移,将开发不太关键的应用程序的开发人员将开发关键业务应用程序,添加支持更复杂用例(如多文档事务)而不使它们复杂化的功能会得到很大改进。

那么,这对昔日的大数据巨头有何影响?洛奇致悼词:

在 [和 MapR] 作为大数据参与者享受了 10 年之后大数据培训是骗局,该行业的重点已经转移到其他地方。领先的云公司不运行大型/Spark 集群,而是在容器基础架构上运行分布式云级数据库和应用程序。他们使用 、R 和其他非 Java 语言进行机器学习。公司越来越多地转向类似的方法,因为他们希望获得同样的速度和规模优势。现在是在 Spark 世界中与时俱进的时候了。

这是开源数据基础架构创新的福气之一,也是祸根之一。这一幕正在以惊人的速度上演,一些供应商在此过程中倒闭。