Loading
0

它用了不起眼的“企业数据中心”,坐稳了全球搜索引擎领先地位

概述

作为全球领先的职位搜索引擎,Jobrapido 公司的使命是“让找工作的人省心”。为此,Jobrapido 公司每月为全球 58 个国家的 7000 多万注册用户提供超过 2000 万个职位。通过利用 Cloudera 企业版构建企业数据中心,Jobrapido 公司始终能够获得对求职者的新洞察以增加网站流量,提升就业率和营业收入。

影响

Jobrapido

“我们的价值主张是根据客户需求提供合格的应聘者。感谢 Cloudera 公司的帮助,我们能够增加网络追踪事件的数量和种类,从而可以帮助企业主更好地了解求职者,并使他们能够在需要时找到所需的应聘者。”

—— Raffaele Serrecchia

Jobrapido 公司的商业智能部门总监

通过与 Cloudera 公司竭诚合作,Jobrapido 公司可以对用户行为和用户参与进行更深入的群组分析,从而改善网站流量,并有助于更好地定位求职者。众多企业也已注意到这一点。

cloudera

“多亏了 Cloudera 公司的帮助,我们能够提高搜索引擎营销(SEM)流程的投资回报率(ROI)。现在,我们可以近实时计算所获得的每个求职者的终身价值,同时还可以通过更深入的 A/B 测试套件提高转化率及变现。”

—— Raffaele Serrecchia

Jobrapido 公司的商业智能部门总监

业务驱动因素

Jobrapido 公司数据科学家发现,利用其现有的数据仓库提取、转换和加载(ETL)以及数据处理所耗费的时间太长,并且经常将一些重要数据源排除在外,而这些数据源是了解求职者终生价值和需求等洞察所需要的。这些因素正制约 Jobrapido 公司达成其使命“让找工作的人省心”。

Serrecchia 说 :“在 Jobrapido 公司,数据被视为是重要的资产,我们投入了大量的精力和资源来挖掘数据的利用,我们的旧数据架构围绕 ETL 数据管道而创建——该数据管道是由同一服务器上运行的多个作业组成。显然,这种解决方案不仅在计算能力方面不可扩展,而且与数据量增长方面也不关联。”

Jobrapido 公司管理者于是转向对公司业务成功至关重要的现代数据平台。

“正确地分析和管理大数据至关重要。我们希望能够确保竞聘者在我们的平台上搜索工作职位时能够获取准确的结果。为了做到这一点,大数据架构对于存储尽可能多的数据而言尤为关键。”

——Michele Pinto

Jobrapido 公司大数据技术团队负责人

面对海量数据的增长,以及各种结构及非结构化数据格式,中联重科决定采用Cloudera CDH 发行版大数据平台来应对挑战。Cloudera 领先的技术和完善的服务能够为中联重科大数据平台的运营提供保障 :通过流式处理架构,满足高时效性的数据分析需求 ;通过分布式运算架构,满足对海量数据的离线深度挖掘。

关键要点

行业

  • 招聘
  • 互联网服务

地理位置

  • 总部:意大利,米兰

支持的业务应用

影响

  • 提高转换率
  • 增加 SEM(搜索引擎营销)流程的

投资回报率

  • 增加网络流量

数据来源及规模

  • 点击流数据
  • 关系数据
  • 应用程序和服务日志
  • 社交媒体数据
  • Google AdWords
  • Google AdSense
  • Google Analytics
  • 数据管理平台(Lotame)
  • SurveyMonkey
  • Eurostat

解决方案

  • 现代化数据平台Cloudera 企业版
  • 工作负载分析型数据库、数据科学和数据工程、操作型数据库
  • 组 件:Apache Flume、ApacheHBase、Apache Hive、ApacheKafka、Apache Impala(孵化中)、Apache Oozie、Apache Spark、Avro和 Hue
  • 数据库:HP Vertica 和 Postgres
  • 商 业 智 能(BI) 及 分 析 工 具:Knime、Microsoft Power BI、Tableau 和 R
  • ETL 工具:Talend

大数据规模

• 2 TB/ 月

解决方案

“我们已经革新了我们的数据平台,用 Cloudera 公司的新型大数据架构替换了原有平台,该数据平台可以大大扩展数据吞吐量,同时提供与我们的数据增长率相匹配的计算能力。Jobrapido 公司所获取的结果是可以消除追踪事件瓶颈的低维护成本的解决方案。因为建立新的追踪所需的成本要低得多,也有助于我们建立数据文化以实现我们的目标。”

—— Michele Pinto

Jobrapido 公司大数据技术团队负责人

该数据平台不仅可以提供快速、灵活的数据处理,而且还支持高性能 SQL 商业智能(BI)和探索。现在可以实时地将数据用于各种任务,包括报表、可视化、分析和机器学习。

例如,Jobrapido 公司应用机器学习算法进行侧写评分以及集群文档和分类。利用该功能可以处理、存储和分析更大的数据量和更广泛的数据类型,包括非结构化文本,Jobrapido 公司因而显著提高了其分类算法的准确性。

此外,利用 Apache Impala(孵化中),Cloudera 平台还为商业智能(BI)分析人员提供了快速洞察的能力。Serrecchia 说 :“我们部门的主要使命是让所有公司相关者能够访问所需的数据。我们使用 Impala 提高数据湖泊的 SQL 查询的性能。Impala 是一项令人难以置信的服务,在数据查询方面向我们展现出了令人影响深刻的性能表现。”

Cloudera 支持团队还为 Jobrapido 公司工作人员提供了宝贵的专业知识,确保他们在部署新的大数据架构取得成功。Pinto 说 :“我们的大数据旅程对我和我的团队而言都是一个很大的挑战,正是与 Cloudera 团队的合作,我们才能取得现在的成果。”

为什么选择 Cloudera ?

凭借 Cloudera 大数据平台,中联重科工业大数据的应用实践不仅为其项目实现了显著的经 Pinto 补充说:“当必须评估最优的 Apache Hadoop 发行版本时,我们选择 Cloudera 公司主要是基于以下三个方面的原因。

首先,Cloudera 公司拥有一个很棒的管理 Hadoop 集群的工具 - Cloudera Manager。第二个原因是 Cloudera 公司已与其他大数据厂商建立了良好的合作伙伴关系。最后,我们团队中的多名工程师拥有多年的 Cloudera 使用经验。”

慧都大数据专业团队为企业提供Cloudera大数据平台搭建,免费业务咨询,定制开发等完整服务,快速、轻松、低成本将任何Hadoop集群从试用阶段转移到生产阶段。

欢迎拨打慧都热线023-68661681或咨询慧都在线客服,我们将帮您转接大数据专业团队,并发送相关资料给您!