范文健康探索娱乐情感热点
热点动态
科技财经
情感日志
励志美文
娱乐时尚
游戏搞笑
探索旅游
历史星座
健康养生
美丽育儿
范文作文
教案论文

智慧城市数据中台数字孪生城市建设方案(57页WORD)

  智慧城市数据中台软件建设数据共享交换
  将共享交换平台一期进行升级。
  具备数据共享交换能力,实现数据归集和数据共享;
  具备政务资源目录管理系统,提供需求清单整理、需求和责任清单处理、需求清单确认、需求清单发布、共享责任清单目录关联等服务;
  支持数据需求梳理驱动编目结合数据资源反向快速编目的方式,实现资源编目。
  具备数据开放平台,提供统一门户、应用中心、数据目录、资源超市、共享成效、政策法规 、互动交流、个人中心、系统管理等功能。大数据资源中心
  (1)数据集成
  把不同来源、格式的数据在逻辑上或物理上有机地集中,主要解决数据的分布性、异构性、有效性和及时性的问题。此外,数据集成是个长期不断持续的过程,需要有易用的工具、长期可靠的运行环境和全面有效的监控管理共同支撑。
  提供工作流的设计客户端,支持作业流设计、脚本类设计和图形化设计。
  支持实现政务数据采集、社会数据采集、广域感知数据采集、免协调业务管道采集的功能。
  (2)系统接口
  支持实现与应用支撑赋能平台、数字孪生城市平台、广域感知平台、与应用系统的接口开发并发布服务。
  (3)数据沙箱
  提供数据支撑、数据处理、安全审核等功能,实现创建基于信创体系的测试安全空间、配置数据置换规则、机器模型设计、机器模型开发、开放数据服务、数据安全审计。
  (4)数据治理开发
  提供数据质量稽核、数据元标准制定、代码标准开发功能。
  实现融合库的数据质量稽核工作。
  实现基础库的数据元标准制定(人员类数据元、机构类数据元、位置类数据元、时间类数据元、公文类数据元、金融类数据元、其他类数据元)、代码标准开发、数据质量稽核工作。
  实现专题库的数据质量稽核工作。
  (5)数据建模
  实现逻辑模型设计与开发;
  实现物理模型设计与开发;
  实现数据模型分析:人口基础库数据模型分析、法人基础库数据模型分析、信用基础库数据模型分析、电子证照基础库数据模型分析、自然资源和地理空间基础库数据模型分析、社会保险基础库数据模型分析、房产交易基础库数据模型分析、电子档案基础库数据模型分析、城市健康发展体验场景专题库数据模型分析、孪生城市市政规划专题库数据模型分析、产业园区数字孪生试点专题库数据模型分析、城市综合态势专题库数据模型分析、城市安全专题库数据模型分析、城市治理专题库数据模型分析、城市服务专题库数据模型分析、文化旅游专题库数据模型分析、交通运行专题库数据模型分析、人口专题库数据模型分析、法人专题库数据模型分析、宏观经济决策专题库数据模型分析。
  实现数据模型开发:人口基础库数据模型开发、法人基础库数据模型开发、信用基础库数据模型开发、电子证照基础库数据模型开发、自然资源和地理空间基础库数据模型分析、社会保险基础库数据模型开发、房产交易基础库数据模型开发、电子档案信息基础库数据模型开发、城市健康发展体验场景专题库数据模型开发、孪生城市市政规划专题库数据模型开发、产业园区数字孪生试点专题库数据模型开发、城市综合态势专题库数据模型开发、城市安全专题库数据模型开发、城市治理专题库数据模型开发、城市服务专题库数据模型开发、文化旅游专题库数据模型开发、交通运行专题库数据模型开发、人口专题库数据模型开发、法人专题库数据模型开发、宏观经济决策专题库数据模型开发。
  (6)人口基础库
  实现人口基础库的信息整合,和数据基础服务,包括:人口信息查询、死亡信息查询、婚姻信息查询、人脉关系查询、人口分布信息查询、人口结构查询、区域人口信息查询、人口基本信息分析、自然人多维检索分析、人口年龄结构分析、区域人口统计分析、暂住人口统计分析、常住人口统计分析。
  (7)法人基础库
  实现法人基础库的信息整合,和数据基础服务,包括:法人信息查询、行政处罚信息查询、行政许可信息查询、法人信用报告查询、法人基本信息统计、区域分布分析、行业分布情况分析、法人信用情况分析、法人从业人员分析。
  (8)信用基础库
  实现数据基础服务,包括:信用公示信息查询、企业信用承诺查询、企业信用评价查询、信用监管信息查询、失信被执行人信息查询、企业信用服务等查询、法人、企业、自然人监测分析、信用评价分析、人口信用情况分析。
  (9)电子证照基础库
  实现数据基础服务,包括:年检电子证照查询、电子证照有效期查询、电子证照照面信息查询、电子证照发证查询、电子证照发证部门统计分析、电子证照类别统计分析、电子证照持有者统计分析、电子证照目录数统计分析、电子证照生成数统计分析。
  (10)地理空间基础库
  实现数据基础服务,包括:地质灾害信息查询、城市网格化数据查询、土地利用遥感监测信息查询、水环境信息查询、水生态水景观水文化信息查询、防洪排涝信息查询、矿产资源统计分析。
  (11)社会保险基础库
  实现数据基础服务,包括:人员基础信息查询、单位基础信息查询、就业创业信息查询、社会保险信息查询、劳动关系查询、重点监察企业筛查、人社画像标签设计、人社画像、人社信用评价、主要行业求人倍率预测、关键职业求人倍率预测、失业预测预警、失业根因分析、高校毕业生就业情况跟踪。
  (12)房产交易基础库
  实现数据基础服务,包括:新房信息查询、二手房信息查询、出租房信息查询、商铺信息查询、写字楼信息查询、厂房信息查询、仓库信息查询、土地信息查询、车位信息查询、新房多维检索分析、二手房多维检索分析、出租房多维检索分析、商铺多维检索分析、写字楼多维检索分析、厂房多维检索分析、仓库多维检索分析、土地多维检索分析、车位多维检索分析、商品房房价趋势分析、公积金/商贷占比分析、手房成交量占比分析。
  (13)电子档案基础库
  实现数据基础服务,包括:电子档案查询、知识库检索、全文检索、智能搜索、档案利用情况分析、档案专题推送服务、档案统计、档案年报、档案知识视图。
  (14)城市健康发展专题库
  实现数据加工服务,包括:区域开发强度专题指标加工、城市人口密度专题指标加工、城市开发强度专题指标加工、社区便民服务设施覆盖率指标加工、社区养老服务设施覆盖率指标加工、普惠性幼儿园覆盖率指标加工、城市建成区积水内涝点密度指标加工、城市万车死亡率指标加工、城市每万人年度较大建设事故发生数指标加工、高峰时间平均机动车速度指标加工、城市道路网密度指标加工、城市常住人口平均单程通勤时间指标加工、居住区停车泊位与小汽车拥有量的比例、公共交通出行分担率(%)指标加工、城市历史文化街区保存完整率指标加工、工业遗产利用率指标加工、城市历史建筑平均密度指标加工、城市生活垃圾回收利用率指标加工、城市生活污水集中收集率指标加工、建成区公厕设置密度指标加工、常住人口基本公共服务覆盖率指标加工、公共空间无障碍设施覆盖率指标加工、房租收入比指标加工、非公经济增长率指标加工、万人高新技术企业数指标加工、全社会R&D支出占GDP比重指标加工、区域健康体检结果展示指标加工、区域健康体检报告输出指标加工。
  (15)市政规划专题库
  实现数据加工服务,包括:一张蓝图指标加工、综合查询指标加工、辅助决策指标加工、城市区位分析指标加工、法定规划展示指标加工、城市五线分布指标加工、选址意向提交指标加工、选址数据校验指标加工、规划选址库指标加工。
  (16)城市综合态势专题库
  实现数据加工服务,包括:城市总体概况指标加工、经济态势指标加工、人口态势指标加工。
  (17)城市安全专题库
  实现数据加工服务,包括:安全隐患指标加工、安全生产指标加工、治安安全指标加工。
  (18)城市治理专题库
  实现数据加工服务,包括:事件治理概览指标加工、12345指标加工、数字化城管指标加工。
  (19)城市服务专题库
  实现数据加工服务,包括:社会保障服务指标加工 、就业服务数据统计、教育服务指标数据治理。
  (20)文化旅游专题库
  实现数据加工服务,包括:旅游出行服务指标数据加工、旅游住宿服务指标加工、公共服务资源指标加工。
  (21)交通运行专题库
  实现数据加工服务,包括:城市道路交通平均车速指标加工、城市道路交通实时路况指标加工、城市道路交通拥堵等级指标加工、公交日均运行速度指标加工、公交出行分担率指标加工、公共交通准点率指标加工。
  (22)人口专题库
  实现数据加工服务,包括:人口属性指标加工、信用属性指标加工、消费特征指标加工。
  (23)法人专题库
  实现数据加工服务,包括:法人基础信息指标加工、组织机构代码信息指标加工、机构注册或登记信息指标加工。
  (24)宏观经济决策专题库
  实现数据加工服务,包括:经济总体状况指标加工、产业经济运行指标加工、中小企业经济运行分析指标加工、企业信用分析指标加工、财政税收分析指标加工。各委办局数据对接
  针对部分委办局数据不能或者比较难获取的情况下,提供合理、合法、合规、安全的数据对接功能。大数据治理中心数据标准管理
  具备数据标准配置、数据标准管理、数据标准化处理、数据标准图谱等功能。
  系统内置数据标准元模型,可自定义追加数据标准数据项,设置数据项类型。支持扩展的控件类型包括输入框、单选框、下拉框,支持数据项与代码集进行绑定,其中代码集可以在线维护,通过对数据标准元模型的定义,动态渲染出数据标准定义、审批、查询界面,从而达到数据标准内容个性化拓展。
  提供从数据标准制定、修订到审批、发布、执行以及版本管控全生命周期管理,管控数据标准化建设每一环节。
  扫描指定范围元数据,识别并提炼核心数据元,支持将扫描结果快速设定为数据标准,扫描范围控制支持全库、数据表集合随意切换。
  数据标准建设一定时期后,难免会出现相似数据标准,降低数据标准质量和可信度。提供数据标准冗余检测能力,检测数据标准间的冗余情况,输出检测结果,并呈现冗余占比。支持对基础数据标准、标准代码、指标标准进行冗余检测。
  支持在数据标准定义阶段检测,将新增数据标准与已存在数据标准进行检测。支持对现行标准库进行检测,检测所有现行数据标准的冗余情况。
  根据业务系统代码,自动推荐匹配的标准代码,为后续业务代码转换为标准代码提供对照关系。
  将标准化处理逻辑抽象为通用程序,在标准化清洗加工时选择标准化程序即可完成数据标准化加工。标准化程序能够快速移植支持导入、导出操作。
  提供数据标准化清洗加工的能力,加工为规范的标准化数据。支持前端可视化操作模式,通过配置数据表,选择标准化程序,由系统按照规则自动创建目标表、生成加工脚本,并完成数据标准化清洗。其中标准化程序支持前端配置,可重复使用。针对复杂标准化清洗逻辑支持在线编写脚本,在线联调测试脚本。标准化清洗加工任务支持手动和周期运行两种模式。元数据管理
  元数据的标准规范遵循 《GBT 21063.3-2007政务信息资源目录体系》、《四川政务信息资源目录编制指南》。
  具备元模型管理、元数据目录管理、元数据采集、元数据总览、元数据版本管理、血缘分析、影响分析、元数据维护、元数据检索和元数据字典等功能。数据标签管理
  具备标签工厂、标签空间、标签计量等功能。
  支持构建灵活的标签体系分类,标签生命周期管理,支持标签生命周期管理,构建衍生标签,标签检索,标签详情查看、包括标签主体对象管理,对象关联原料数据集管理,标签目录管理,并支持批量导入/导出标签类止及标签基本属性初始化。
  支持标签做相应的权限控制(私有公有),以及标签的操作权限控制;
  支持将分布在不同数据库(大数据平台或普通关系型数据库)里主体关联的"碎片"数据进行逻辑整合,实现主体对象的跨域建模。具体业务动作为对标签对象主体关联的数据集进行维护,支持选择表、字段与主体绑定,用作标签加工的"原材料"。通过批量指定表字段与标签的映射关系,快速进行离线加工标签的初始化。
  平台应支持用户自定义标签规则、标签加工引擎读取规则自动加工加工结果自动落表。具体应该包含以下三种动态打标模式:1.SQL模式:提供可以基于标准SQL语法操作原料数据集进行动态打标的标签定义功能;2.拖拽模式:提供基于已有标签轻松拖拽实现组合运行并配合一定的业务限定条件产生新的标签的标签定义功能;3.手动打标模式:提供通过导入名册的形式直接圈定部分个体并人工的为其打上特定标签的功能;
  支持批量选择单个主体对象的标签在线化配置快捷发布为API服务;
  平台应提供完毕的标签计量功能,实现标签主体对象成本效益分析,具体要求从标签容量、标签运行情况、标签调用情况三个维度进行综合计量:标签容量计量:对单个主体对象相关标签存储占用情况进行计量,计量指标应包含存储容量、月存储增长率、标签记录数、记录增长率、表数量等,同时应对存储变化趋势从存储量及记录数两个维度进行综合分析;标签运行计量:对单个主体对象相关标签的运行情况进行计量,计量指标应包含标签数、等待运行数、运行中标签数、等待运行数、运行报错数以及暂停使用标签数等,同时应对标签运行耗时进行趋势分析;标签调用计量:对单个主体对象相关标签的调用情况进行计量,计量指标应包含开放标签数、标签服务总数、本日新增标签服务、本日调用失败次数等,同时应对标签调用情况进行趋势分析。
  平台应向用户提供个性化的标签空间,提供包含标签概览、标签检索及个人空间三个子功能。实现对全局标签总览、标签检索查找、个人发布、收藏标签管理、生成主题表、我的草稿及标签详情查看功能。
  平台应提供标签详情查看功能,应支持标签基本信息、标签值域分布、标签血缘、运行情况、调用情况、变更记录、业务规则等信息的查看。数据资产管理
  具备数据资产概览、数据地图、数据规划、资产管理、资产评估等功能。
  提供异构数据源的字段类型映射关系的自定义配置,便于在自动建表时精确依据源端表所在数据源的类型,来生成目标端表的建表语句,无需人工编写和调整建表语句。
  多任务配置模式,满足复杂场景。支持向导、脚本、整库迁移三种模式,支持单次全量、周期全量、周期增量三种数据集成调度模式,全方位覆盖各类数据集成场景。
  向导模式采用图形化方式配置数据源、数据表和字段映射关系,可以进行多表集成并自定义同步范围,并支持在目标端在无目标表的情况下使用自动建表配置规则进行自动建表功能完成任务配置,无需用户提前在目标端手动建表。数据质量管理
  具备质量规则管理、核检规则配置、可视化流程配置、数据校验组件库、流程化问题修复、数据质量报告等功能。
  通过数据质量平台总览,快速洞察平台的整体运行情况。按照不同的时间维度,查看表异常数据量排名、作业告警排名、平台质量问题趋势、质量维度的分布情况等。
  质量检核规则提炼和定义,是数据质量管理平台的重点和难点,也是平台的基础。平台支持高效灵活的讲质量检核的业务规则,通过脚本定义的方式,高效的转化为平台规则模板,在质量检核作业配置中,进行高效复用。规则模板经过不断积累,逐步形成各个行业的质量规则库,沉淀形成平台的重要资产。
  质量规则管理人员将业务中提炼的数据质量规则,通过自定义脚本的方式,创建到系统中,进行高效复用和灵活配置。新建规则时,关联质量维度、规则分类和规则目录,设置表参数和字段参数,调用规则函数,设置多个规则检核结果。
  数据质量检核作业的业务场景总体分为两种类型:第一种,基于数据库的基础检核作业;第二,基于业务属性的场景化作业。两种作业的特性各不相同,数据库基础质量检核作业是常规作业,规则相似度高且可复用;场景化作业往往是基于具体的业务场景,规则往往比较复杂,不可复用。
  新建作业时,系统会提示是否应用上次编辑的作业草稿(编辑后未保存提交的作业信息),选择"确定",即可回显之前的编辑内容,在之前作业编辑基础上,继续完成编辑。
  向导模式适用于数据库的基础检核作业,无需编码,基于规则模板,通过可视化配置,便可轻松实现数据质量检核。
  自定义模式适用于个性化、面向具体业务场景,较为负责的检核作业,多是对业务的数据表进行检核,这种检核规则往往不可复用,需要即配即用。自定义模式支持灵活定义字段与阈值,字段与字段的规则,和快速创建规则脚本。
  质量检核作业可以在不同时间多次执行,每次检核生成一个作业运行实例,平台会监控并记录作业每一次运行的状态和检核结果。在作业实例管理列表中,支持查看作业量、运行时间、作业进度等与作业运行相关的全部指标,包括检核结果数据:规则告警数、异常数据量。作业进度,系统每30秒刷新一次;当前作业性能,执行效率为每秒检核100万条数据。
  系统会提前24小时,加载定时调度的作业到列表中待运行,对于待运行的作业,质量检核人员可以根据需要终止运行。对于运行异常的作业,系统会自动重启,用户端无感知。
  对于运行成功的作业实例,质量检核人员可以进行异常确认,异常确认分为确认治理和规则异常两种情况。作业检核的结果与实际相符,需要确认治理,从而推送给相应的责任人,让责任人了解质量情况及时治理。如果检核结果与实际不相符,比如检核的表被删除了,检核结果异常,就需要报规则异常,让作业创建人重新编辑作业配置。
  作业实例详情和作业详情的区别,是非常明确的。作业运行实例详情是统计分析作业单次运行的结果数据,而作业详情是汇总作业每一次运行的结果数据。
  进入报告管理页面,可以查看并管理已经生成的质量报告,并进行推送和下载操作。一份报告可以多次推送,系统会记录并跟踪报告的签收情况。
  作业运行结束后,平台就可以基于多次作业运行的综合结果,选定数据范围和报告周期,配置并生成质量报告。系统支持对单库多表进行质量分析,基于选定的运行时间区间,汇总报告配置范围内符合条件的最新数据,进行综合分析。
  如果配置的报告有价值,质量管理人员就可以点击生成报告,系统会分配唯一的报告编号并生成标准格式的质量检核报告。已生成的报告,支持推送、预览和下载,还可以管理列表中管理查看。
  系统支持质量报告下载,下载成PDF、Word形式到本地,便于打印和分发传阅。质量报告的样式,贴近于政府公文的形式,简洁大气,重点明确,数据详实。同时,报告还具备图文服务,内容详实的特点,对实际业务和数据治理具有较强的指导性。大数据服务中心
  具备API管理、API服务集市、API服务台、API监控分析、服务与授权、订阅推送等功能。
  平台应支持将单个主体对象的标签集发布为API服务的能力。且应具备基于标签快速构建主题对象明细查询接口服务以及基于标签构建针对主体对象多维聚合分析接口的能力。
  平台应通过以API市场的形式实现数据服务的复用和广域赋能。平台应提供数据服务目录便于用户按需检索所需的数据服务,支持通过服务名称、访问权限类型、API类型等条件便捷检索所需数据服务;支持数据服务详情查看;支持数据服务的在线调试和申请试用操作。
  平台应面向API服务构建者提供细致的管理功能,应支持对自有API的分类管理,支持API的批量上线、下线操作,支持单个API详情 查看、调用监控及接入应用管理功能。API调用监控内容应包含API调用情况、接入应用TOP5、报错日志等信息;接入应用管理应以列表形式展示调用该API的所有应用列表,列表应包含应用名称、应用描述、授权时间、到期时间、剩余次数等信息。
  平台应以图形化的形式对API调用及费用情况进行专项计量。费用计量应包含管理应用数、累计调用API数量、本月累计总调用次数、本月费用等指标,同时分费用、次数两个维度对API调用变化趋势进行分析。
  平台应支持数据消费者按需自行注册应用,且单用户可注册应用数最高可达100个。数据消费者可以对单个应用接入的API进行运行状态监控及调用余量监控,监控的指标应包含调用次数、失败率、平均耗时等,同时应支持对最近24小时、最近一周、最近一月的调用次数进行分析。大数据智能分析系统
  (1)自助分析
  支持新增、编辑等管理,支持分组管理;支持基于查询条件、二维表展示、附带图文进行可视化配置的功能;支持最终用户使用配置完成的分析功能对目标数据进行自助分析。
  (2)数据看板
  支持新增、编辑等管理,支持分组管理;支持内置数据看板模板,用户可以基于模板快速定制数据看板,同时可以将已有设计另存为模板;支持可视化设计,能够拖拽组件、设置组件属性、页面布局等功能;最终用户使用配置完成的数据看板模型对目标数据进行分析。
  (3)智能报告
  支持新增、编辑等管理,支持分组管理;支持内置智能报告模板,用户可以基于模板快速定制智能报告,同时可以将已有设计另存为模板;支持可视化设计,能够拖拽组件、设置组件属性、页面布局,类word操作完成智能报告设计;支持对设计完成的报告进行订阅,让报告周期性自动产生,并发送至指定的邮箱。
  (4)数据门户
  支持将自助分析、智能报告、驾驶舱集合组织起来,提供外部链接的功能。大数据基础平台
  (1)分布式存储
  提供线性扩展、高可靠、开放等能力。提供多租户安全可靠的分布式对象存储能力,支持适配国产芯片处理器和国产操作系统体系。
  (2)离线计算引擎
  基于分布式离线计算框架,支持将MR/Spark/Tez等复杂任务,通过结构化语言对海量结构化数据进行统一处理分析汇总的高性能分析引擎,适配国产芯片处理器和国产操作系统体系。
  (3)实时计算引擎
  基于批流一体框架和分布式复杂流式处理引擎,支持对无边界和有边界的数据流,提供低延迟、可扩展、高容错的有状态的实时流式复杂计算,适配国产芯片处理器和国产操作系统体系。
  (4)全文检索
  支持PB级海量结构化和非结构化文本数据存储能力,提供故障探测、自动报警及集群高可用能力,支持高性能、高并发、低延时的查询能力,适配国产芯片处理器和国产操作系统体系。大数据集成中心
  具备数据集成、数据共享交换(前置交换)、万物互联感知、免协调业务管道采集等功能。
  平台提供异构数据源的字段类型映射关系的自定义配置,便于在自动建表时精确依据源端表所在数据源的类型,来生成目标端表的建表语句,无需人工编写和调整建表语句。
  任务配置满足复杂场景。支持向导、脚本、整库迁移三种模式,支持单次全量、周期全量、周期增量三种数据集成调度模式,全方位覆盖各类数据集成场景。
  向导模式采用图形化方式配置数据源、数据表和字段映射关系,可以进行多表集成并自定义同步范围,并支持在目标端在无目标表的情况下使用自动建表配置规则进行自动建表功能完成任务配置,无需用户提前在目标端手动建表。
  系统提供定时任务,对集成任务中配置的源端表进行扫描,通过配置信息和源端表实时信息进行比对,及时发现源端表结构变化,并判断是否影响任务运行,同时,对影响任务运行的变化提供修复功能,在线修复任务配置信息,有效减少任务报错次数。
  任务运行完成后,通过比对源端数据量和目标端数据量,列出产生脏数据的任务清单,支持查看对应的脏数据明细信息以及造成脏数据的原因,并提供补数据功能,用户只需点击补数据,就可实现一步完成数据修补,保证数据量的完整性。
  实时监控集成任务的运行情况,可对任务进行冻结、解冻、重跑、终止等操作以及一体化的可视化界面,任务属性、运行日志、运行代码、结果预览同步展示,用户只需通过简单的切换就可清楚查看任务的相关信息。大数据开发平台
  (1)离线计算
  支持对大数据处理过程进行可视化管理与控制。屏蔽底层复杂的分布式计算引擎,构建基于Web的数据开发平台。面向数据开发人员可提供可视化数据开发IDE,实现数据开发、数据同步、任务调度、任务运维一体化作业。
  应具备良好的兼容性,兼容主流开源或商业化大数据平台;支持离线同步、Shell、类SQL、MR等多种节点类型,通过节点之间的相互依赖,对复杂的数据进行计算处理;支持分钟、小时、天、周和月多种调度周期配置,支持根据时间、依赖关系,进行任务触发的机制。
  支持通过项目空间来实现组织、人员、数据源、计算资源的安全隔离。项目空间初始化时支持为单个项目空间分配独立的调度资源池来实现计算资源的精准调控和分配。项目配置时支持对项目的基本属性、成员、资源访问权限进行维护以及对数据源、计算引擎进行查看。其中基础配置应支持对项目空间中是否启用"周期调度"、"能下载select结果"、"允许编辑任务"、"允许运行任务"、"允许脚本建表"、"启用数据同步"等进行控制,同时对查询结果的记录条数及上传文件大小限制进行预设置。资源访问权限则是对当前项目人员能够访问其他项目空间数据表资源进行限制,在保证数据安全隔离的同时保证了项目空间间正常的数据协同。
  平台提供任务管理、脚本管理、资源管理、函数管理、表查阅五种功能,实现海量数据的离线计算和数据"下云",满足数据开发人员不同编码习惯不同业务场景需要。
  平台应提供可视化引用数据标准创建数据模型的能力,实现模型创建的标准化和便捷化。
  开发者可上传本地自定义的jar、txt或json文件作为资源,在节点运行时使用(如创建自定义函数、加载数据等)。
  支持系统函数和自定义函数,系统函数主要包括字符函数、数学函数,日期函数,聚合函数等,同时支持自定义函数。
  支持对当前项目空间所有能使用的表的字段信息、分区信息进行查看,对表数据进行预览;提供字段引用、表名拖拽方式,快速生成SQL语句;支持在线可视化建表。
  对整个运维中心的任务(流)进行统一查看,包括任务总数、运行成功、失败、运行中、等待资源的任务总数,动态展示任务(流)的执行情况等。支持对任务的冻结、解冻、补数据操作,可以查看任务每次运行实例的运行日志、运行代码。
  针对单个任务可自定义预警项目(任务完成、任务未完成、任务出错、任务超时),确定任务接收人,当系统检测到对应任务有触发预定规则的,将通过邮件、系统消息、短信等告警方式向相关接收人推送预警信息。
  (2)实时计算
  支持通过项目空间来实现组织、人员、数据源、计算资源的安全隔离。项目空间初始化时支持为单个项目空间分配独立的调度资源池来实现计算资源的精准调控和分配。项目配置时支持对项目的基本属性、成员进行维护以及对数据源、计算引擎进行查看。其中基础配置应支持对项目空间中是否启用"实时采集"、"上传资源"、"FlinkSQL脚本模式"等进行控制。同时对任务的并行度及上传文件大小限制进行预设置。
  平台应在提供实时计算脚本在线编辑的基础功能之上,将脚本编写过程中常用的算子封装为可视化的组件,用户只需轻松拖拽组件简单配置便可实现实时数据处理。屏蔽脚本开发的复杂性,降低对实时数据开发人员的技术要求,提升实时数据开发效率。要求提供的组件应包含数据源表、数据维表、数据处理、结果表四类,其中数据处理组件应包含连接、过滤、聚合、字段转换等组件。
  开发者可上传本地自定义的jar、python或文件作为资源,在节点运行时使用(如创建自定义函数)。
  支持系统函数和自定义函数,系统函数主要包括字符函数、数学函数,日期函数,聚合函数等,同时支持自定义函数。
  对实时采集任务、实时计算任务的运维管理功能,支持任务运行状态总览、查看单任务运行状态及对当前任务进行修改,提交,停止,续跑操作。应支持单个任务的运行监控、运行日志查看、运行代码查看及告警配置功能。其中运行监控的指标项应包含输入/输出RPS,输入/输出BPS,累计输入/输出记录数,累计输入/输出数据量等。
  针对单个任务可自定义预警项目(任务失败,任务停止、消费延迟),确定任务接收人,当系统检测到对应任务有触发预定规则的,将通过邮件、系统消息等告警方式向相关接收人推送预警信息。大数据安全中心
  从数据采集安全、数据存储安全、数据传输安全、数据使用安全四个方面来全面管理控制数据全流程安全。提供对数据库表、文件、图片、视频等结构化和非结构化数据的安全管理功能。数据沙箱平台
  (1)数据源管理
  支持通过与数据源进行数据连接(支持HDFS、MySQL、Oracle、Hive、Cache、SQLServer六种类型连接数据源)方式连接/获取数据源信息。
  支持CSV、xls、xlsx、ZIP四种文件类型上传数据,支持UTF-8、GBK两种数据编码格式。
  支持对数据源的批量操作,包括同步、删除、启用、禁用;支持管理和查询数据表、数据字段。
  支持数据预览。
  支持导入数据字典文件。
  (2)沙箱环境初始化
  支持用户的批量导入、导出,支持导入用户时创建用户组、并且将用户加入到用户组当中。
  支持通过控制用户的IP地址(黑名单或白名单)和MAC地址(黑名单或白名单)以及访问时段控制,限制用户访问。
  支持用户的批量修改,包括重置密码、修改有效期、修改登录时段、修改IP限制、修改MAC限制。
  (3)数据空间管理
  支持为每个数据空间独建租户,在多租户环境下,各个数据空间共用相同的系统或程序组件,并且可确保彼此间数据的隔离。支持系统管理员查询数据空间的资源情况,并对相应的存储资源使用进行授权。
  (4)表空间管理
  对数据管理员进行授权,用于在沙箱的宿主数据库上进行数据库表空间的管理,数据管理员只需要把业务信息填写到表单上,后台即可自适配SQL语法生成相应的语句来执行。所填写的业务信息主要有表空间的名称,表空间文件的路径,初始化大小(G)等。
  管理员可创建一个大的表空间,给所有沙箱用户使用。并且可以对表空间的默认分配容量进行设置。当业务用户进行空间申请时,默认的按此容量分配空间额度。
  管理员可以查看表空间目前的数据库用户列表信息,以及各用户目前的数据情况和空间使用情况。当察觉到异常情况时,可以先对数据库用户进行锁定操作,以待核查后再决定是否解锁。当后台监控统计发现表空间容量超过90%时,推送短消息给系统管理员,以便通知其进行扩容操作。
  (5)数据同步
  支持新建抽样任务,配置项包含数据源、输出到调试环境、数据置换策略等。
  支持预览抽样结果(文件数据和数据表均支持)。
  支持批量运行、终止、上送、删除抽样任务。
  支持上送样本数据到调试环境。
  (6)数据置换
  支持结构化、非结构化数据的数据置换。
  支持对诸如姓名、身份证号、手机号、邮箱、通讯地址等个人敏感信息实体设置不同的置换算法和算法参数。
  对结构化数据支持至少三种不同置换算法,如敏感数据替换、敏感数据遮掩、敏感数据擦除。
  对非结构化数据支持马赛克遮罩算法,支持针对不同实体配置选择遮罩颜色。
  支持批量删除、批量启用、批量禁用数据置换策略。
  支持脱敏后结果输出到指定数据库或sftp/ftp文件。
  (7)数据访问控制
  支持基于深度学习的NLP技术对个人隐私信息进行识别,包括人名、机构名、地址等。
  支持基于深度学习的OCR技术对图片中的文字信息进行识别。
  具备识别结果上下文语境的动态感知能力,进而对识别精度进行优化调节。
  支持批量删除、批量启用、批量禁用敏感数据发现规则。
  支持对任意敏感数据发现规则的自定义设置,基于传统正则表达式和字典两种模式设置匹配规则。
  支持通过DLP技术与规则匹配实现敏感数据自动发现,支持系统自动发现与手工调整相结合。
  支持对用户、样本数据进行数据访问控制。
  支持批量删除、批量启用、批量禁用策略。
  (8)机器学习工作台
  支持交互式Notebook编程,提供基于python编程语言的代码编程和调试环境,支持pandas、 pytorch、sklearn等框架。
  支持数据分析师导出zip格式数据文件或模型文件。
  支持查看组件运行错误日志,查看全量数据运行日志。
  实验过程中支持对数据融合分析场景的隐私保护,支持在调试环境对样本数据进行分析后,使用全量数据进行数据分析。
  (9)数据可视化处理
  支持查看样本数据概述、说明等信息。
  支持设置样本数据公开/私有属性。
  支持样本数据预览。
  支持可视化拖拽式数据分析方式,包含数据源、数据拆分、自定义Python程序等数据分析组件。
  支持可视化数据转换操作,如过滤、替换、提取、拆分、函数、可见字段选择等,支持质量分析图、数据分布图、详细数据等不同维度展示数据。
  (10)数据操作留痕审计
  支持对所有的用户数据操作进行了全生命周期的日志记录,实现所有数据操作可追溯、可审计、可定责。同时,针对用户行为的日志记录进行风险分析与识别,严格保障数据安全。
  支持导出系统登录日志和系统操作日志的详细记录。
  支持对操作用户在数据安全开放平台运行环境内的所有操作行为进行记录和审计。
  (11)结果申报审核
  支持对数据分析得到的最终结果的流出严格把控,基于智能反隐私隐藏技术的深度内容审核,智能识别敏感数据,结合基于白名单机制的人工审核方式,双管齐下,防止攻击者从流出结果中夹带敏感数据,充分保障数据安全。数据中台规范编制技术管理规范
  提供《数据模型管理规范》,《数据共享交换平台开发规范》,《基础库开发规范》,《专题库开发规范》。数据标准
  提供《数据资源目录规范》,《代码类标准规范》,《基础数据元标准规范(人口分册)》,《基础数据元标准规范(法人分册)》。数据管控规范
  提供《数据标准管理办法》,《数据质量管理办法》,《数据安全管理办法》,《数据隐私保护指南》,《数据资产管理办法》,《元数据管理办法》。运营管理规范
  提供《数据共享服务管理办法》,《数据采集管理办法》,《数据交换共享平台管理办法》。数据中台性能目标总体性能指标基于分布式架构,具有很强的容错能力,错误恢复能力,错误记录及预警能力,具备异地容灾能力;能支持同构、异构网络分布操作,支持松散耦合及海量并行处理;提供稳定高效(7*24)的计算引擎,同时具备离线批计算和实时流式计算,满足海量数据处理和复杂逻辑运算以及实时反馈计算结果的需求;系统支持从硬件层面,数据层面到业务层面高可用,满足系统可用性;系统易于部署和扩展,支持版本迭代;基于组件化和模块化的架构,支持与常用大数据组件无缝结合,满足用户自定义的需求;系统在存储节点发生故障(硬盘损坏,网络抖动,机柜故障等),保持数据的完整性,或者提供数据完整恢复的能力;具有完整的安全性(帐号安全,系统级权限,对象安全性,审查等),细粒度化的访问控制,适合于多层环境的安全模式的能力;系统具备专业的认证体系和数据访问机制,保障数据安全;确保系统具有高度的安全性,提供安全的登录和访问措施,防止系统被攻击;支持上千级任务并发调度运行;数据规模-能够处理数据规模PB级以上的数据;文件规模-能够处理百万规模以上的文件数量;节点规模-能够处理1000节点以上的规模。计算资源性能指标数据接入性能指标单工作节点的处理能力要求达到 30 MB/s;单工作节点的处理能力要求达到 30000Records/s;支持集群部署,性能随集群节点扩充性能近线性提升;支持不低于100个数据并发链路,正常50个并发链路的性能;离线计算性能指标亿级单表查询秒级左右响应时间,亿级表关联操作不超过10秒;支持超过1000的任务并发,任务丢失率小于等于千分之一;实时计算性能指标单数据节点QPS超过1000,并且可通过简单增加节点数量的方式进行水平无缝扩展,并在分布式架构下多节点集群QPS可达百万级;源数据导入系统的响应延迟在秒级以内,数据计算处理的延迟在秒级以内;实时流处理支持最大50万目标,时延不大于5秒;局部节点故障分钟级自动恢复并对用户透明。共享开放性能指标数据共享与业务协同支持关系型数据和非关系型数据,文件型支持各种文本文件,关系数据库支持 Oracle、DB2、MySQL、SQLServer、达梦、金仓、神通等国内外主流数据库,支持 MongoDB、Hbase、Redis等非关系型数据库;数据共享机构数 300个;每次数据交换,1MB以内的文件域内用时 3秒,省、市跨域数据交换用时 5 秒;交换节点可扩展,不影响当前业务的运行。数据开放支持进行公共数据的开放及数据存储;最小支持 5000 系统用户同时在线访问,最小支持 2000 个用户并发;用户检索单条数据响应时间 3 秒。

给我10亿粉丝我就能打败百度,滴滴,美团前几天有个38亿买了981个公众号的新闻刷爆了新闻圈,引起了很多媒体的质疑,但是在我看来这家公司应该是赚大了。因为这2。4亿粉丝,就相当于2。4亿的用户,在中国2。4的用户估值多少微信订阅号最新全新改版优质内容和标题党的红利昨天微信公众号发布了订阅号改版的信息,今天笔者就赶快体验了下,尝鲜下。体验了后,不得不说这次改版非常完美。首先订阅号列表不再显得那么杂乱无章以前的订阅号点进去后,由于每个公众号都是舞台光束灯三大系统是怎样相互配合的阜新声艺视听光束灯是集电子机械光学为一体的高科技产品。合格的光束灯,必须稳定可靠,光效优良定位准确散热性好灯体及材料结构符合人机工程要求。光束灯从使用功率的大小可分为250W575W1200W更适合大部分Macbook用户的拓展坞ORICO八合一雷电3拓展坞大家都知道,MacBook一般在一侧是由两个雷电接口的,但是市面上大部分单接口有雷电3水平的拓展坞价格都过于昂贵或者需要独立的供电,大部分MacBook用户其实是不需要这类型的产品ROGZ11降级升级散热,ROG飞龙240一体式水冷体验在这之前个人Z11电脑主机所用的散热是ROG自家的龙神240,搭配到Z11这款机箱真心是非常的搭调好看,实际散热性能也是完全够用,但由于期间换了VII显卡搞了黑苹果系统,那么由于龙列车部队来袭!MS雷电合体腿部官图公布等了两年多,第三方厂家MoonStudio(以下简称MS)终于公布了合体金刚雷电前两位成员月影和雪风的实拍官图,我们一起来看看他们的具体表现!首先来看一下MS01暗夜月影和MS02干货组合商标如何注册更有利?拆如果您想让您的商标看起来更独特,那么你在准备申请商标的时候可以考虑注册一个组合商标!组合商标是指用文字图形字母数字三维标志和颜色组合六要素中任何两种或两种以上的要素组合而成的商标。我给女票定制了台粉色少女电脑每年为女票过生日送礼物都要绞尽脑汁,要各种查攻略,也要查女票最近微博转发记录,差不多赶上情报站了。然后今年女票特意叮嘱我说不要送口红,不要送香水,不要送包,要送个务实的东西,我就随知产晨报腾讯群组合并专利获授权,韩国拟立法对抗谷歌苹果垄断8月25日知识产权快讯1hr专利腾讯群组合并专利获授权,N个微信群或能合并8月24日,腾讯科技(深圳)有限公司获得会话群组的合并方法装置终端及存储介质专利授权,公告号CN111279。2分的神仙组合,这治愈综艺来得太是时候!阜新声艺视听生活里最必不可少的,一定有小卖部的存在。超市关门,商场太远,唯有家门口的小卖部,能够最迅速地满足需求。不管是天还未亮的清晨,还是夜深人静的时分,亮着灯的小卖部总能给我们带来一丝温暖直击你的少女心,粉色TFZMYLOVE4体验女朋友一直想要一款粉色的有线耳机,要求就是颜值必须要高,音质也不能太差,音质要求很容易搞定,粉色高颜值却让我犯了难。最近听说TFZ(锦瑟香也)更新了MYLOVE系列,恰好又有一款粉
京东618全面启动1000个新品类增长超100碳排放同比降低55月20日,在第18个京东618来临之际,以让热爱不止于消费为主题的2021京东618,18周年庆启动暨趋势发布会在北京举行,国内外数百名知名品牌商家合作伙伴代表与京东共同开启20高通创投进一步扩展在华投资,持续培育5GAI生态创新在2021高通技术与合作峰会上,高通创投宣布对五家中国公司的风险投资,其中包括对聚焦机器人和人工智能(AI)的科技企业庞勃特蜂窝车联网(CV2X)和计算机视觉相关解决方案提供商卓视平台化数字化娱乐化生态化新国美为何如此独特?近段时间以来,在零售领域,国美正成为大众瞩目的焦点,从去年11。11的万人直播到今年真快乐APP的上线,新国美频频引发热议。人们关注这家拥有深厚底蕴的零售巨头正在经历怎样的转型升级创维汽车开启未来智能汽车新征程2021年4月27日,开沃新能源汽车集团在北京举办创维汽车品牌见面会,正式发布创维汽车品牌。开沃新能源汽车集团自成立以来,在新能源汽车领域深耕和布局十来年,已经形成了完备的研发制造家生活战略延展升级国美携手打扮家开创透明家装新格局国美家生活战略2。0阶段又推出重要落子。4月29日下午两点,BIM智能装修平台国美X打扮家家居家装战略暨APP上线发布会在北京雁栖湖国际会议中心隆重举行。来自行业协会的领导供应链伙共情最难得!苏宁六一宝宝节打响618第一枪当前618的档期已经拉开大幕,各大平台与商家纷纷推出新颖的活动。以苏宁易购为例,从关晓彤贾乃亮魔性TVC齐刷大小屏,到联合奇葩说团队打造的掰头大会精彩开辩,再到5月31日上演的百大渠道助力销售新国货品牌SKG发布会当天新品上线2小时即售罄伴随各行业出现不同程度的生产过剩的情况,渠道选择在销售环节中的地位越来越突出,其对品牌资产的积累和最终销售结果起着决定性作用。针对该趋势,品牌需不断读懂用户健康需求,洞悉用户消费偏高端手机市场暗流涌动,荣耀50系列发布破局行业困象有这样一则特殊的数据,在中国手机市场里具有里程碑式的意义。Canalys数据显示,600美元以上的中国智能手机出货量,在2019年第二季度为1100万部,2020年第二季度增长到1重构高端手机市场格局,荣耀50系列正式发布6月16日,荣耀数字系列的最新一代,荣耀50系列正式发布。伴随智能手机市场格局大变,行业进入大浪淘沙的重构期,定位美学设计标杆的荣耀50系列成为破局的关键,也是荣耀在极致产品主义理realme真我Q3系列发布,萤火虫照亮千元机市场realme真我Q3系列发布,印证了一个手机行业的新特征如今,手机价位和配置强度之前已经没有必然联系了。这款新机还未发布就被誉为千元机皇,真我Q3系列为什么如此受到市场的追捧?最表realme真我GT大师系列发布2399元起售站稳旗舰质价比之王2021年7月21日中国北京全球成长最快的智能手机品牌realme真我于今日在北京举办真我GT大师系列旗舰新品发布会。作为realme两周年梦想之作,真我GT大师系列的外观设计由r