本月22号,美国大数据人工智能公司Databricks宣布其获得4亿美元的F轮融资,领投方为 Andreessen Horowitz’s Late Stage Venture Fund,BlackRoc、T. Rowe Price Associates 和 Tiger Global Management 也参与了本轮融资。据悉,本次融资主要用于扩大研发规模和进行全球市场布局。本轮过后,Databricks已经达到了62亿美元的估值。
这也是今年2月份该公司完成E轮2.5亿美元融资后一年内的第二次融资。在E轮融资中,投资方有Andreessen Horowitz、Coatue Management、Microsoft(微软)和 New Enterprise Associates (NEA) 。其中作为资方的微软,据报道还曾于 2017 年和 Databricks 合作推出了一种用于处理和分析大量企业数据流的工具——Azure Databricks。
图片源自Databricks
作为一家后期的创业公司,这样大规模的融资比较少见。Databricks 联合创始人兼首席执行官Ali Ghodsi表示本轮融资是一次里程碑,公司将在未来的某个时间进行IPO,目前还没有准确的时间可以透露,但上市是公司“最终目标”,所以 Databricks 可能在不久的将来就登陆二级市场。据悉,Databricks在完成本轮融资的同时也聘请Dave Conte为新任CFO,他之前担任Splunk的首席财务官,帮助公司完成了上市。
Databricks是2013年由加州大学伯克利分校(UCB)负责开发开源Apache Spark数据处理框架的团队创建的,他们为数据科学团队提供了一个统一的分析平台,以便与数据工程和业务部门合作构建数据产品。
目前Databricks提供四种产品: Delta Lake——开源的数据湖产品;MLflow——帮助数据团队使用机器学习的开源框架;Koalas——为Spark和Pandos创建单一的机器框架,简化使用这两种工具的工作;Spark——开源分析引擎。其中,MLflow和Delta Lake是今年10月份在阿姆斯特丹的Spark+AI欧洲峰会上发布的新产品。
MLflow是集成到统一数据分析平台(UDAP)中的,但是可以在开源代码的基础上与其他平台进行集成。MLflow可以用来协助机器学习实验和模型管理,可以记录不同算法和超参数配置,以及应用它们生成模型的准确性。MLflow还定义了一个模型持久化格式,这使模型可以共享。
Delta Lake是建立在Spark SQL和存储在Databricks文件系统中的Parquet文件之上的存储层。通过使用差异(delta!)文件和特殊索引,Databricks为它的数据湖添加了重要的功能,使其具有更高的性能、与传统关系数据库相同的事务管理特性和ACID兼容性。这意味着可以将新数据添加到湖中,然后立即进行有效查询,这可以解决数据湖的一个关键痛点。
Databricks的统一数据分析平台(UDAP)是一个基于云进行管理和优化的Spark服务,可以直接从亚马逊云服务上获得,也可以从Azure云上以微软支持服务的形式获得。最近,Databricks向UDAP添加了上述新的功能,使其性能超越了Spark、Notebook和其他基本功能。
Databricks产品的开源版本都可以直接在网上下载,但是怎么使用这些产品来为我们工作却并不是一件容易的事情。Databricks以SAAS的形式向客户提供产品,并且负责解决使用中遇到的所有问题。当然,“订阅”这些服务是收费的。
根据Databricks提供的报告,该公司的今年的收入预测将要比去年增长2.5倍以上,目前的收入为2亿美元。Databricks在全球拥有超过2000家客户,包括Nielsen(尼尔森)、Shell(壳牌)、HP(惠普)和ZEISS(蔡司)等大型企业,这些大型客户使得公司的财务表现持续向好。Ghodsi表示“我们一年之前根本没有预测到这种趋势”。
随着各项业务的强劲表现,同时又拥有了新的资金,Databricks计划建立专门工程团队来推进Delta Lake、MLflow和Koalas的优化升级工作。同时Ghodsi表示他们在阿姆斯特丹的欧洲工程中心在过去两年内增长了将近三倍,所以他们也计划在欧洲增加投资一亿欧元。除了这些,Databricks还计划为在欧洲、中东、非洲、亚太地区和拉丁美洲的市场扩张提供资金。
当很多人还在讨论怎么通过开源的方式建立一种成功的商业模式的时候,Databricks已经通过这种方式取得了不错的业绩增长。Ghodsi表示,这种增长证明了公司的开源战略的有效性。基于云的开源软件SAAS商业模式有一个更为人熟知的名字——“Red Hat (红帽)商业模式”,在这种模式下服务商提供开源软件,依靠技术支持服务、培训和咨询取得收入。