About us / 实验室简介
服务于大数据的应用市场需求推动大数据在金融行业的应用加速大数据业务及技术的能力建设加强与社会的交流合作和人才培养实验室简介       金融大数据实验室全称“面向金融行业的大数据处理平台北京市工程实验室”,在国内大数据产业蓬勃发展的背景下,由中金数据系统有限公司斥重资完成实验室设施和专业的大数据技术团队建设,于2014年10月通过北京市发改委专家审核,获批成为北京市级重点工程实验室并正式挂牌。建设宗旨:■ 深入行业,面向应用,合作共建,资源开放建设目标:■ 建设国内知名、行业领先的大数据业务创新中心■ 服务于大数据的应用市场需求■ 推动大数据在金融行业的应用■ 加速大数据业务及技术的能力建设■ 加强与社会的交流合作和人才培养 研究方向:■ 掌握大数据平台核心技术,在海量数据管理、异构数据集成以及复杂数据挖掘分析等方面建立竞争优势。■ 重点面向金融机构的客户经营、征信辅助、金融安全等领域,研究开发金融行业大数据应用产品。■ 充分理解和适应大数据技术特征,研究开发新的模型体系,改进金融业务分析方法。■ 探索数据资源采集与处理的技术方法和商业模式,促进数据积累与应用。查看更多
Applications / 应用案例
  • 1
  • 2
  • 3
News / 新闻动态
数据共享与开放式银行
数据共享与开放式银行像“大数据”这样的流行语通常会让“数据猿人”联想到定量分析,例如机器学习算法和统计分析应用。虽然这些方法及应用是透析数据本质、挖掘数据价值的关键步骤,但数据领域一个更加基础的模块便是获取数据。现阶段,如何大规模地收集和分享数据已经成为各行各业的热门话题,例如政府部门公开部分数据以提高行政职能部门的透明度。数据共享通常通过应用程序编程接口(API)来实现,这是一种智能管道,允许以受控但无缝的方式在系统之间传输数据,具体可见表1(来源于:McKinsey Payments Practice)。多年来,API已经在银行业务环境中得到了充分利用,鉴于先进分析技术的突破以及众多非银行金融科技公司的市场吸引力,API正在作为向零售消费者和商业客户提供金融服务的手段,重新受到各界的广泛关注。开放式银行作为数据共享的实际应用之一,其潜在好处包括改善客户体验,创造新的收入来源,以及提供可持续的服务模式。虽然开放式银行有利于终端用户,并促进银行和非银行之间的技术和领域竞争,但也可能迎来一个全新的金融服务生态系统,银行未来的角色可能会发生显著转变。开放式银行业务可以定义一种协作模式,在这种模式中,银行数据通过两个或多个无关联方之间的API共享,从而为时长提供增强的功能。API已经被使用了数十年,特别是在发达国家,使得个人财务管理软件能够在银行网站上呈现计费细节,并将开发者连接到Visa之类的支付网络。但迄今为止,这些关系主要用于分享信息,而不是转移货币余额。随着数据生态系统的日趋成熟,类似腾讯、阿里巴巴等诸多企业会开始发生数据碰撞,数据无法共享将损害到每一家企业的商业利益及其运营模式的创新。此外,大部分的数据都来自金融服务领域之外的公司,虽然银行拥有丰富的交易数据以及可信的客户关系,但他们往往把这些数据流的开放视为威胁而不是新的机遇。共享“精简档案”消费者的有限数据可以帮助推进金融领域的包容性,集中有限的信息以获得更准确的风险评分和信贷承保决策。通过向正规金融体系引入更多的消费者,开放式银行业务将增加市场机会和未来提供盈利性服务的潜力。虽然开发式银行业务会导致现有银行在某种程度上受到冲击,但它们可以通过预测分析、人工智能等技术手段,提升客户粘性、深度挖掘客户价值,例如支付宝、微信通过它们的平台实现增加版的电子商务,提供更流畅的个性化体验以及包括点对点在内的全套支付选项...
2017 - 11 - 17
数据共享与开放式银行
数据共享与开放式银行像“大数据”这样的流行语通常会让“数据猿人”联想到定量分析,例如机器学习算法和统计分析应用。虽然这些方法及应用是透析数据本质、挖掘数据价值的关键步骤,但数据领域一个更加基础的模块便是获取数据。现阶段,如何大规模地收集和分享数据已经成为各行各业的热门话题,例如政府部门公开部分数据以提高行政职能部门的透明度。数据共享通常通过应用程序编程接口(API)来实现,这是一种智能管道,允许以受控但无缝的方式在系统之间传输数据,具体可见表1(来源于:McKinsey Payments Practice)。多年来,API已经在银行业务环境中得到了充分利用,鉴于先进分析技术的突破以及众多非银行金融科技公司的市场吸引力,API正在作为向零售消费者和商业客户提供金融服务的手段,重新受到各界的广泛关注。开放式银行作为数据共享的实际应用之一,其潜在好处包括改善客户体验,创造新的收入来源,以及提供可持续的服务模式。虽然开放式银行有利于终端用户,并促进银行和非银行之间的技术和领域竞争,但也可能迎来一个全新的金融服务生态系统,银行未来的角色可能会发生显著转变。开放式银行业务可以定义一种协作模式,在这种模式中,银行数据通过两个或多个无关联方之间的API共享,从而为时长提供增强的功能。API已经被使用了数十年,特别是在发达国家,使得个人财务管理软件能够在银行网站上呈现计费细节,并将开发者连接到Visa之类的支付网络。但迄今为止,这些关系主要用于分享信息,而不是转移货币余额。随着数据生态系统的日趋成熟,类似腾讯、阿里巴巴等诸多企业会开始发生数据碰撞,数据无法共享将损害到每一家企业的商业利益及其运营模式的创新。此外,大部分的数据都来自金融服务领域之外的公司,虽然银行拥有丰富的交易数据以及可信的客户关系,但他们往往把这些数据流的开放视为威胁而不是新的机遇。共享“精简档案”消费者的有限数据可以帮助推进金融领域的包容性,集中有限的信息以获得更准确的风险评分和信贷承保决策。通过向正规金融体系引入更多的消费者,开放式银行业务将增加市场机会和未来提供盈利性服务的潜力。虽然开发式银行业务会导致现有银行在某种程度上受到冲击,但它们可以通过预测分析、人工智能等技术手段,提升客户粘性、深度挖掘客户价值,例如支付宝、微信通过它们的平台实现增加版的电子商务,提供更流畅的个性化体验以及包括点对点在内的全套支付选项...
2017 - 11 - 17
语义视角下的跨学科与跨界数据认知
语义视角下的跨学科与跨界数据认知来源: THU数据派 日期:2017-11-08作者:赵强在这个新技术、新商业、新城市、新环境等加速迭代的智能时代,不断涌现的革新挑战着人们传统的意识和粗浅的认知。本期由清华-青岛数据科学研究院主办,中国科促会清数大数据产业联盟、清华校友AI大数据专委会(筹)承办的清华大数据“应用·创新”系列讲座将从语义视角切入数据认知领域,试图寻找跨学科与跨界的共识机制,探寻学术与商业合作过程中所需要的能力。嘉宾简介:清华-青岛数据科学研究院大数据基础设施研究中心副主任赵强老师,其本人为北京大学计算语言学博士,研究方向为语义学,2012年起转向高校和企业的多学科跨界融合产学研对接工作,提出社会化大规模实验的新概念,参与北大、清华、复旦等多项产业前沿项目,在知识图谱、语义网络、区块链应用、性格匹配、情感计算、文本语义分析等方向上有深入探索。  本期讲座将围绕大数据基础设施、社会化大数据试验和场景数据化三个方面展开。 以下是演讲实录:  “大数据基础设施要解决的,是面向积累、面向需求形成标准或者共识的那一部分。”  随着各种各样的大数据项目的增加,我们开始关心它的数据可视化是不是够炫,政务项目是不是做得很好,或者是关心某一些特定的项目是不是能够赚钱。但是事实上绝大多数的项目都需要大数据基础设施的支撑,这个词不常见,但是它将慢慢地成为一个非常重要的事情。在某种意义上,大数据基础设施的互用性是非常大的,譬如说一个数据中心,或是SDN软件定义网络,或是数据的智能调度,或是数据安全以及在数据中心的日志维修等方面,都会有大量的知识。用我们中心主任徐葳老师的话来说,大数据基础设施基本上就是隐藏在整个光鲜的应用背后一系列的苦工作,平时大家看不到,但是一旦大家能感觉得到,这就一定是出了大问题。  我个人的学习经历是从89年进入北大之后,95年、96年开始做编词典的工作,做汉语语法信息词典和汉语语义词典,现在比较时髦叫语义网、知识图谱,这是一种能够让人和机器都读懂的、具有共性的、处于整个数据应用层底层的技术和资源,是大数据基础设施层的内容。那么,大数据基础设施都包括哪些内容呢?可以看出,大数据基础设施包涵很多技术层面,但都是底层的非应用型的技术。大数据基础设施要解决的,是面向积累、面向需要可能形成的标准,或者共识这样的部分,需要长期的积累,...
2017 - 11 - 10
大数据技术赋能金融业创新与应用升级
大数据技术赋能金融业创新与应用升级日期: 2017年11月15日来源: 36大数据作者:李虹含大数据时代将带来人类生产力的又一次大解放和生产效率的巨大提高,移动互联网络将成为实现中国梦的重要载体,这本质上需要相互联通相互融合的大金融体系。然而,多年来我国金融监管体系相互独立,银行、证券、保险行业相互割裂,难以适应大数据时代金融发展的要求,当前虽然面临着移动互联带来的巨大机遇,但难以把握,反而受到互联网企业的全面渗透,各行业处于不改变就被改变的境地。相关各方应该以金融监管协调部际联席会议制度建立为契机,加大体制和机制创新力度,加大金融领域中银行、证券、保险领域的相互开放力度,促进金融机构尽快转变理念、融入互联网精神,支持其在大金融体系下的金融创新和做大做强。从国际看,IBM、INTEL 等巨型公司都向大数据业务转型,而金融服务领域天生就是数据和信息密集型产业,在这个领域谁拥有更多的数据,谁就占领先机。本文将以金融机构数据应用现状、前景和创新维度等方面探讨大数据技术在金融业创新与应用升级方面的重要作用。一、金融机构数据应用的现状目前,金融机构实现了所有核心业务系统的电脑化处理,计算机应用覆盖了本外币储蓄、本外币对公、国际贸易结算、信用卡、信贷管理等业务领域。同时金融机构每时每刻都在搜集和处理大量的信息,包括公司和个人的账户信息、公司和个人的贷款信息和企业、行业、产业、产品信息等等。特别是随着金融机构数据集中工程实施后,金融机构的各级营业网点和业务部门要对总部返回所有交易、业务类数据。如何利用好这些宝贵的信息资源,获取有益的信息,以便更好地为客户服务,提高金融机构经营管理水平和利润,是当前金融机构争相研究的核心热点问题。建立基于数据仓库技术的一个信息管理平台,采用数据挖掘技术,适时、智能地抽取所需数据,并通过完善灵活的定义方式,运用科学、实用的分析工具,结合金融系统安全管理的特点,为管理决策人员及相关业务人员提供灵高效、可靠、实用的管理分析工具。现代金融机构当中,数据资产成为其区别于传统金融机构的最大生产要素之一,利用大数据技术与数据挖掘方法对于数据资产的管理、运用、挖掘,成为现代金融业加快创新、增强管理能力等业务的最重要工作。大数据挖掘分析决策的主要流程见下图1。银行业海量的数据内容,需要从“数据清理/整合——数据仓库——数据选择——数据挖掘——模式评价——知识”多次的...
2017 - 11 - 17
有没有想过,你的数据分析方法可能已经过时?
有没有想过,你的数据分析方法可能已经过时?来源:灯塔大数据时间:2017-11-07信息时代,能吃到虫子的已不再是早起的鸟儿,而是那些数据驱动的、早起的鸟儿。像百度、阿里巴巴和腾讯这样的大公司,都在不断囤积数据,因为他们都知道数据是金灿灿的宝贝。仅仅囤积数据是不够的。你需要熟练地筛选、全盘了解数据湖中溢出的所有数据。只有这样,你才能通过这些数据,做出更好的决策,打造更智能的产品。  然而,在拥挤不堪、投资过剩的数据分析市场上,供应商为了卖出自己的产品不断放出烟雾弹,想要穿过烟雾看到“真相”,却是一大难事。以下五点,是未来数据分析市场可能的走向,仅供参考。BI迁移到应用程序在过去的20年里,我们见证了一场革命。不是一夜之间发生的那种,而是逐渐发生的,缓慢的,可能很多人没有注意到。BI(商业智能)正走向死亡。或者更准确地说,BI正在进行着彻头彻尾的改变。每年,用户都在通过他们使用的应用程序——比如HubSpot、SalesForce和MailChimp——进行更多的分析。分析正在迁移到业务应用程序的结构中。从本质上讲,业务应用程序正在获取它们自己的分析接口,根据它们的数据和用例进行定制。这种集成和自定义使得其分析接口比深奥的、复杂的通用BI更容易被用户接受。随着B2B应用程序开始在数据智能产品上展开竞争,这一趋势将会继续下去。 编译器超越分析引擎历史上,数据分析有两种提供方式:通过预计算,或者通过分析引擎。分析引擎,如Spark和Tableau的数据引擎,负责执行所需的计算,以回答关于组织数据的关键问题。现在,这个领域出现了一个新的玩家:分析编译器。分析编译器可以灵活地将计算部署到不同的基础设施。分析编译器的例子包括现在大火的TensorFlow,它可以将计算部署到GPU或CPU等。编译器比分析引擎灵活得多,因为它们可以进行数据处理,而且我们可以将它们进行转换,以在不同的基础设施中运行(在数据库中,在Spark中,在GPU中,等等)。在理论上,编译器也可以生成比任何解释引擎都快的工作流。甚至Spark也一直在获取基本的编译工具,这无疑是编译器在此驻留的标志,并且可能最终会使遗留的纯计算引擎相形见绌。   ETL多样化很少有一个术语能比“ETL”(提取转换加载)更让大佬们头疼。ETL堆积了大量不完整的、重复的、不相关的数据,像污水一...
2017 - 11 - 10
Products / 产品与方案
产品特点: 统一数据管理平台     统一数据管理平台定位为企业的数据汇集平台。        为企业内各部门间信息共享、数据服务开放和应用融合,提供为有利的技术支撑。平台是基于大数据架构的,采用通用的开源Hadoop资源管理框架,确保平台的大数据技术的先进性与良好的兼容性。 数据规划管理:平台通过建立动态数据资源目录,实现动态的元数据管理。平台提供数据的全生命周期的管理,包括数据采集规则、数据结构、数据描述、数据量、数据关联关系、数据质量、数据安全、数据更新周期、数据生命周期等方面。 数据的归集与预处理:平台提供图形化的数据流处理能力,能够将转换、汇总计算、排序、合并、数据加载等组合为数据处理流程,同时还提供一些非结构化数据处理引擎,比如语音转换成文本。 数据服务:查询分析引擎提供高效的大数据查询分析,引擎支持hive、hbase、spark等多种数据存储。 数据运营管理:平台自带数据运营管理功能,为运营团队提供管理工具,支持服务发布和运行监控,作业调度管控,数据资产管控和安全审计等。通过动态监控和预警帮助运维管理人员随时掌握系统运行状态,提前预防及处理问题。
产品特点: 全生命周期客户经营大数据解决方案 方案定义     中金数据“客户经营大数据解决方案”是以协助企业建立数据驱动的全生命周期客户经营体系为目标,综合利用云计算、大数据、人工智能等技术构建企业统一数据管理平台和应用产品服务体系,为企业经营提供客户画像、行为分析、智能营销、服务关怀、风险控制全流程服务支持。  方案功能与应用场景 (每个功能模块都可以作为子系统)  ● 定位公司数据汇集平台 ● 为公司内各部门间信息共享、数据服务开放和应用融合,提供有利技术支撑● 基于大数据架构的,采用通用的开源Hadoop资源管理框架,确保平台的大数据技术的先进性与良好的兼容性  ● 综合运用企业内部数据和第三方数据● 基于客户的行为属性、价值属性、忠诚属性、风险属性● 实现客户全景画像和行为分析,为客户识别、产品设计、精准营销、客户服务、风险识别提供支撑,提高客户经营效率,优化客户经营决策  ● 可实现实时在线推荐和批量精准营销的数据型应用产品● 基于精确的客户数据和产品信息● 通过智能引擎对接各种在线渠道系统,实现定向营销和实时推荐,降低营销成本,提高销售收入  ● 客服坐席服务质量自动化评价和电话销售合规性自动化检查● 以语音识别、语义分析技术为基础,通过可灵活配置的规则引擎实现自动化批量检测,识别出风险录音● 将传统模式下不到2%的抽检率提升到100%覆盖,大幅提升人工质检的复核效率,降低运营风险和人力成本  ● 客服坐席服务质量自动化评价和电话销售合规性自动化检查● 以语音识别、语义分析技术为基础,通过可灵活配置的规则引擎实现自动化批量检测,识别出风险录音● 将传统模式下不到2%的抽检率提升到100%覆盖,大幅提升人工质检的复核效率,降低运营风险和人力成本  ● 基于大数据技术对互联网用户在公开渠道发布信息● 归集、抽取和集成,利用文本分析技术开展数据建模分析后,用于业务品牌监测、用户群体行为洞察、公共危机预警的应用系统方案特点 ■ 技术先进可靠   综合运用云计算、大数据、人工智能技术,平台可靠不间断服务。■ 架构灵活开放   兼容主流技术...
产品特点: 语音大数据分析云

友情链接: