浅谈对大数据的理解

13 篇文章 0 订阅
订阅专栏

大数据(big data):

指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

4V特征:

容量(Volume):数据体量大,数据的大小决定所考虑的数据的价值的和潜在的信息;
种类(Variety):数据类型的多样性,包括传统数据库、图像、文件和其他复杂的记录,如果只有单一的数据,那么这些数据就没有了价值,比如只有单一的个人数据,或者单一的用户提交数据,这些数据还不能称为大数据,所以说大数据还需要是多样性的,比如当前的上网用户中,年龄,学历,爱好,性格等等每个人的特征都不一样,这个也就是大数据的多样性,当然了如果扩展到全国,那么数据的多样性会更强,每个地区,每个时间段,都会存在各种各样的数据多样性。;
速度(Velocity):指获得数据的速度,就是通过算法对数据的逻辑处理速度非常快,1秒定律,可从各种类型的数据中快速获得高价值的信息,这一点也是和传统的数据挖掘技术有着本质的不同。;
价值(Value):指价值密度低,,你如果有1PB以上的全国所有20-35年轻人的上网数据的时候,那么它自然就有了商业价值,比如通过分析这些数据,我们就知道这些人的爱好,进而指导产品的发展方向等等。如果有了全国几百万病人的数据,根据这些数据进行分析就能预测疾病的发生,这些都是大数据的价值;

原理价值:

某比萨店的电话铃响了,客服人员拿起电话。
客服:XXX比萨店。您好,请问有什么需要我为您服务 ?
顾客:你好,我想要一份……
客服:先生,烦请先把您的会员卡号告诉我。
顾客:16846146***。客服:陈先生,您好!您是住在泉州路一号12楼1205室,您家电话是2646****,您公司电话是4666****,您的手机是1391234****。请问您想用哪一个电话付费?
顾客:你为什么知道我所有的电话号码?
客服:陈先生,因为我们联机到CRM系统。
顾客:我想要一个海鲜比萨……
客服:陈先生,海鲜比萨不适合您。
顾客:为什么?
客服:根据您的医疗记录,你的血压和胆固醇都偏高。
顾客:那你们有什么可以推荐的?
客服:您可以试试我们的低脂健康比萨。
顾客:你怎么知道我会喜欢吃这种的?
客服:您上星期一在中央图书馆借了一本《低脂健康食谱》。
顾客:好。那我要一个家庭特大号比萨,要付多少钱?
客服:99元,这个足够您一家六口吃了。但您母亲应该少吃,她上个月刚刚做了心脏搭桥手术,还处在恢复期。
顾客:那可以刷卡吗?
客服:陈先生,对不起。请您付现款,因为您的信用卡已经刷爆了,您现在还欠银行4807元,而且还不包括房贷利息。
顾客:那我先去附近的提款机提款。
客服:陈先生,根据您的记录,您已经超过今日提款限额。
顾客:算了,你们直接把比萨送我家吧,家里有现金。你们多久会送到?
客服:大约30分钟。如果您不想等,可以自己骑车来。
顾客:为什么?
客服:根据我们CRM全球定位系统的车辆行驶自动跟踪系统记录。您登记有一辆车号为SB-748的摩托车,而目前您正在解放路东段华联商场右侧骑着这辆摩托车。

大数据VS小数据

小数据跟大数据的根本区别在于:小数据以单个人(个体)为唯一对象,重点在于深度,即像一位忠诚细致的“个人管家”那样对个人数据进行全方位、全天候地深入精确分析,同时还可主动灵活地设置各种外界访问权限以保护个人隐私;而大数据则侧重在某个领域(群体),大范围、大规模地进行数据的全面收集处理分析,侧重点在于广度。
在这里插入图片描述

使用场景

一般来讲,大数据的推动力是一种被动刺激。各个公司和一些专业行政机构,无论他们是否愿意,都不得不存储和检索大量收集到的数据
在这里插入图片描述
大数据无处不在,大数据应用于各个行业,包括金融、汽车、餐饮、电信、能源、体能和娱乐等在内的社会各行各业都已经融入了大数据的印迹。
制造业,利用工业大数据提升制造业水平,包括产品故障诊断与预测、分析工艺流程、改进生产工艺,优化生产过程能耗、工业供应链分析与优化、生产计划与排程。

金融行业:大数据在高频交易、社交情绪分析和信贷风险分析三大金融创新领域发挥重大作用。

汽车行业:利用大数据和物联网技术的无人驾驶汽车,在不远的未来将走入我们的日常生活。

互联网行业:借助于大数据技术,可以分析客户行为,进行商品推荐和针对性广告投放。

电信行业:利用大数据技术实现客户离网分析,及时掌握客户离网倾向,出台客户挽留措施。

能源行业:随着智能电网的发展,电力公司可以掌握海量的用户用电信息,利用大数据技术分析用户用电模式,可以改进电网运行,合理设计电力需求响应系统,确保电网运行安全。

物流行业:利用大数据优化物流网络,提高物流效率,降低物流成本。

城市管理:可以利用大数据实现智能交通、环保监测、城市规划和智能安防。

生物医学:大数据可以帮助我们实现流行病预测、智慧医疗、健康管理,同时还可以帮助我们解读DNA,了解更多的生命奥秘。

体育娱乐:大数据可以帮助我们训练球队,决定投拍哪种题财的影视作品,以及预测比赛结果。

安全领域:政府可以利用大数据技术构建起强大的国家安全保障体系,企业可以利用大数据抵御网络攻击,警察可以借助大数据来预防犯罪。

个人生活: 大数据还可以应用于个人生活,利用与每个人相关联的“个人大数据”,分析个人生活行为习惯,为其提供更加周到的个性化服务。
大数据的价值,远远不止于此,大数据对各行各业的渗透,大大推动了社会生产和生活,未来必将产生重大而深远的影响。

案例讲解

假设你正在使用智能手机搜索意大利餐厅,只需几步,你的手机就会列出在你当前位置10个街道范围之内的意大利餐厅。在此过程中,被查询的数据库庞大且复杂:一个映射数据库收集了世界上的所有餐厅,餐厅的经纬度、地址和由顾客给出的评分会持续更新,但是数据库的输出是小数据,例如,在街景地图上标出来5个餐厅,以及这些餐厅的准确地址、电话号码和评分。你要做的只是从这5家餐厅中选择一家,并享受佳肴。

在此案例中,你的数据选择源自一个大型的数据集,但你最终的分析仅利用了一个小数据集(即满足搜索条件的5家餐厅)。大数据资源是为了提供小数据集。分析工作并非基于大数据资源―大数据资源仅仅用于搜索和检索,因此,大数据资源的真正工作是收集和组织复杂数据,以便资源能够为你的检索做好准备。在此过程中,数据创造者需要做很多决定,例如,酒吧是否应该列入餐厅范围之内?外卖是如何点餐的?应当收集什么数据?缺失数据应当如何处理?数据如何存储?

上述是大数据如何起作用的一个典型案例―通过创建小数据集可以有效地进行分析。也就是说大数据经过ETL的复杂转换过程,最终所要达到的目的是为了给小数据提供服务的,也就是给具体行为或者个体等服务的。

博客
关于对智慧城市行业的几点思考
02-23 579
对智慧城市行业的理解与思考
博客
解决方案评价
07-14 1717
    解决方案评价的目的是评估解决方案是否已达到预期商业结果的能力。例如提供通过/不通过商业和技术决策的信息,或识别收益递减点。同时用来识别新需求或变更后的需求,这可能会导致解决方案的细化或提出新的解决方案。一、评价方式    在项目实战中、解决方案评价领域实际有以下四种评价方式。解决方案绩效评估:描述了运营解决方案如何在执行中贴近商业目的和目标。解决方案确认评估:评估了解决方案在可接受的质量水平上能够达到商业需
博客
合理竞争和内卷竞争的边界?
07-25 2207
内卷化(involution),又译为“过密化”,是近年来在中国社会学研究领域被认为“和中国社会的某些特色联系密切且使用频率较高、影响较广泛的概念”。这一概念随着黄宗智研究20世纪中国农村社会变迁的著作《长江三角洲小农家庭与乡村发展》在国内的出版,引起了国内学者的注意,美国学者杜赞奇研究20世纪上半期华北农村社会变迁的著作《文化、权力与国家——1900-1949年的华北》在国内出版后,吸引了更多的国内学者使用内卷化这一概念对中国社会进行研究。以上引自百度百科。最近因为准备考试在疯狂刷题,那么问题来了,好
博客
微服务架构认识与构建
06-17 552
一、微服务架构是什么1.1微服务架构的概念微服务架构倡导我们在传统软件应用架构的基础上,将系统业务按照功能拆分为更加细粒度的服务,所拆分的每一个服务都是一个独立的应用,这些应用对外提供公共的API,可以独立承担对外服务的职责,通过此种思想方式所开发的软件服务实体就是“微服务”,而围绕微服务思想构建的一系列体系架构(包括开发、测试、部署等),我们将其称为“微服务架构”。根据微服务架构的定义,将传统的单体架构拆分为微服务架构的方式,如图所示:从图中可以看出,微服务架构将传统单体架构中的订单服务、商品服
博客
对过去的事情做思维演练:复盘思维
06-02 1349
☞人才除了要信誉好、能折腾之外,还要有主人意识。【序言】复盘是古老的东方思维,孟子说“仁者如射”,这句话其实在某种程度上代表联想复盘文化的精神。是说射箭这个人,摆好姿势把箭射出去,如果射不到,不要埋怨客观原因,而是要从中间吸取某些营养。复盘被总结为联想文化中方法论的重要组成部分,已经进一步把它变成一个组织学习的方法。今天我们一起来学习柳传志先生的独特思维及对人才观、领导力的创见。一、复盘思维1、何为复盘?“复盘”这个词最早来源于棋类术语,也称“复局”,指对局完毕后,复演该盘棋的记录,以检查对局中
博客
简述对互联网产品经理的认识
05-05 1059
一、什么是产品?产品在广义上指的是能够投放于市场,供人们使用与消费,满足其需求的所有东西。具体来讲:是以企业经营为目标的载体与具体表现形式,其本身是具有商业属性的。可能这样说还是比较抽象,举个例子吧,比如我们在路上看到的树木这些都不是产品,但突然有一天有个人发现把木头做成桌椅可以卖钱,于是桌椅就成为了产品,因为它承载了这个人的“经营目标”,并且有了具体的表现形式(桌椅)。二、什么是互联网产...
博客
产品VS项目,产品经理VS项目经理
03-29 532
产品:用来解决某个问题的东西,可以是有形的实物,也可以是无形的服务。项目:只会进行一次,包含多项互相关联的任务,并且有绩效、时间、成本和范围限制的一项工作。做产品VS做项目第一、从生命周期的角度来看做产品的生命周期相对较长,关注的整个产品从规划到制造,再最终到维护和消亡的整个过程。而项目有特定的目标,所以生命周期较短,通常在项目开始以前就有明确的起始和结束时间,通过验收则表示项目生命周...
博客
Web开发语言Java,Php,.Net对比
03-24 815
一、语言:PHP:PHP产生与1994年,其语法混合了C、Java、Perl 和他自创的一些编程语法;PHP是嵌入在HTML中执行的;它也是一种解释性语言。早期的PHP并非完全的面向对象编程语言,到了PHP4以后的版本才开始有了面向对象的概念。JAVA:JAVA产生与1995年,JAVA语言和JAVA平台统称为JAVA;它语法与C语言和C++语言很接近,并且JAVA是面向对象编程语言,JA...
博客
大数据分析模型介绍
03-24 1698
一、渠道分析1、名词解释:渠道,即企业(产品)与用户产生互动的各个触点,比如搜索引擎、社交媒体、广告平台、线下站会等等。一个完整的用户旅程,通常包括:站外渠道→展示创意→投放 URL →着陆页→辅助转化文案及 CTA →应用商店(仅移动端)→产品转化 6大关键环节,每个环节都有相应的指标来衡量渠道入口。渠道分析模型用于分析用户(包括访客)的访问来源,通过访问用户数、访问次数、访问时长、跳出...
博客
Hadoop系列之Zookeeper完全分布模式安装(三)
02-28 699
详细配置截图笔记链接:http://note.youdao.com/noteshare?id=b071910d980ec4819dd8a67596bdf35a实验目的要求: Zookeeper的完全分布模式的安装Zookeeper服务能够正常启动和连接Zookeeper控制台能够正常进入Zookeeper控制台命令能够正常使用实验环境:★ 五台独立虚拟机★ 主机之间有效的网络连...
博客
SaaS智能风控服务演进之路
02-26 1105
1、智能风控数据流体系2、传统智能风控架构3、问题与挑战在传统智能风控体系下存在如下三点挑战:1)如何支持灵活多变的业务需求?2)如何满足客户对系统的个性化需求?性能准确性稳定性3)如何应对大流量及突发流量?4)如何支持在数据快速增长现状下,进行实时特征计算和数据查询?4、解决方案1)机构&应用&存储优化①微服务化②集群动态分配③特征计算优...
博客
BI体系架构及相关技术介绍
02-24 1万+
一、BI介绍BI(Business Intelligence),中文译名是商务智能。较为严谨的定义:“商务智能是企业利用现代信息技术收集、管理和分析结构化和非结构化的商务数据和信息,创造和累计商务知识和见解,改善商务决策水平,采取有效的商务行动,完善各种商务流程,提升各方面商务绩效,增强综合竞争力的智慧和能力。”比较简洁的定义:商务智能好比“数据炼油厂”,即把商业活动中累积的数据加工成可用于...
博客
基于阿里云之大数据学习:使用DataV制作实时销售数据可视化大屏
12-25 3025
学习目标:了解数据可视化应用场景掌握阿里云DataV可视化工具了解可视化大屏制作流程使用DataV模板制作数据可视化大屏一、数据可视化介绍1、数据可视化:是指将相对复杂的数据通过可视的、交互的方式进行展示,从而形象、直观的表达数据蕴含的信息和规律。包含展示类、分析类、监控类三种。2、可视化目的展示企业形象传播峰会论坛展台嘉宾访客接待驱动查看业务实况业务监控预警...
博客
Windows客户端使用frp访问Linux服务器端
12-10 1556
frp 是一个可用于内网穿透的高性能的反向代理应用,支持 tcp, udp 协议,为 http 和 https 应用协议提供了额外的能力,且尝试性支持了点对点穿透。1、frp下载(Windows&Linux)地址:https://github.com/fatedier/frp/releases/2、根据对应的操作系统及架构,从 Release 页面下载最新版本的程序。将 frps 及...
博客
过程性记录2019/12
12-03 545
1、回顾OSI七层参考模型:https://blog.csdn.net/yaopeng_2005/article/details/70648692、隧道连接内网数据库:https://github.com/fatedier/frp3、Elasticsearch安装配置:https://blog.csdn.net/mottohlm/article/details/808752074、El...
博客
认识ElasticSearch分布式架构(五)
11-19 430
1、解析ES的分布式架构1.1 分布式架构的透明隐藏特性ElasticSearch是一个分布式系统,隐藏了复杂的处理机制。(1)集群发现机制(cluster discovery):比如当前我们启动了一个es进程,当启动了第二个es进程时,这个进程作为一个node自动就发现了集群,并且加入了进去(2)shard负载均衡:比如现在有10shard,集群中有3个节点,es会进行均衡的进行分配...
博客
pycharm社区版和专业版的不同
11-12 5508
!!!记录一次坑,pycharm社区版不支持远程开发。细致再细致。
博客
爬虫之代理池学习(二)
11-07 400
接上一篇:爬虫之代理池学习(一)7、实现数据库模块在这里插入代码片8、实现代理IP爬虫模块在这里插入代码片9、实现代理IP检测模块在这里插入代码片10、实现代理IP检测模块在这里插入代码片11、实现代理IP池启动入口在这里插入代码片...
博客
爬虫之代理池学习(一)
11-06 553
1、代理池概述2、代理池的设计3、实现代理的思路4、实现代理IP模型类5、代理IP的工具模块6、实现代理IP的校验模块
博客
PyCharm使用lxml库报错(ModuleNotFoundError: No module named 'lxml')解决办法
11-06 2万+
1、在学习爬虫时遇到ModuleNotFoundError: No module named 'lxml’错误2、起初考虑是自己的lxml库有问题,卸载以后重新安装pip install lxml -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com3、重新安装lxml库时,错误没有解决,百度各种方式后无果,经...

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • 商业模式分析——以饿了么、美团外卖为例 92643
  • 滴滴出行商业模式分析 47026
  • 浅谈对大数据的理解 42522
  • 数据库原理及其应用(SQL server2012)习题详解-习题8 29415
  • PyCharm使用lxml库报错(ModuleNotFoundError: No module named 'lxml')解决办法 25828

分类专栏

  • 笔记 5篇
  • 云安全技术 7篇
  • 安全运维 10篇
  • openstack部署 11篇
  • 基于Hadoop的spark大数据开发实战 1篇
  • 职业规划
  • 数据通信 3篇
  • Oracle 1篇
  • Linux 3篇
  • 虚拟化 12篇
  • SQLserver 3篇
  • 云存储 13篇
  • 其它 6篇
  • MongoDB 2篇
  • 前端 4篇
  • 云安全技术 10篇
  • python数据分析与应用 10篇
  • 云应用系统 12篇
  • Java 5篇

最新评论

  • PyCharm使用lxml库报错(ModuleNotFoundError: No module named 'lxml')解决办法

    scon: 亲测有效,折磨好久了

  • 基于阿里云之大数据学习:使用DataV制作实时销售数据可视化大屏

    佛山-唐绍程: 能把sql 发我的邮箱吗,我的邮箱:173440598@QQ.com https://edu.aliyun.com/course/394/material/6411/download,这个地址下载不了,

  • PyCharm使用lxml库报错(ModuleNotFoundError: No module named 'lxml')解决办法

    是肥宅SRP啊: 终于!解决了!谢谢博主!

  • PyCharm使用lxml库报错(ModuleNotFoundError: No module named 'lxml')解决办法

    hitoutatu: 亲测有效

  • Java基础学习之学生管理系统实现(四)

    m0_72954837: 为什么isUsed报错

您愿意向朋友推荐“博客详情页”吗?

  • 强烈不推荐
  • 不推荐
  • 一般般
  • 推荐
  • 强烈推荐
提交

最新文章

  • 关于对智慧城市行业的几点思考
  • 解决方案评价
  • 合理竞争和内卷竞争的边界?
2023年1篇
2021年1篇
2020年10篇
2019年64篇
2018年29篇

目录

目录

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

两个鬼故事ktv软件问佛祁隆演唱异形vs人类张姓生猪宝宝起名大全有意义的诗句起名字宝宝起名哪里有什么2021女孩起名李姓起名拼音未来聊天群易经起名称全集爱新觉罗起名一笑渡凡间手袋公司起名拼布教室起名键盘连点侠盗魅影男扮女装小说时光飞逝的短句唯美咪咕阅读英字起名的意义闻鸡起舞的意思畜牧养殖公司起名大全崔字男孩起名大全上官金虹男宝起名字擦鞋店管道设备公司起名张梓后面起什么名98分光滑的反义词广东体育少年生前被连续抽血16次?多部门介入两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”淀粉肠小王子日销售额涨超10倍高中生被打伤下体休学 邯郸通报单亲妈妈陷入热恋 14岁儿子报警何赛飞追着代拍打雅江山火三名扑火人员牺牲系谣言张家界的山上“长”满了韩国人?男孩8年未见母亲被告知被遗忘中国拥有亿元资产的家庭达13.3万户19岁小伙救下5人后溺亡 多方发声315晚会后胖东来又人满为患了张立群任西安交通大学校长“重生之我在北大当嫡校长”男子被猫抓伤后确诊“猫抓病”测试车高速逃费 小米:已补缴周杰伦一审败诉网易网友洛杉矶偶遇贾玲今日春分倪萍分享减重40斤方法七年后宇文玥被薅头发捞上岸许家印被限制高消费萧美琴窜访捷克 外交部回应联合利华开始重组专访95后高颜值猪保姆胖东来员工每周单休无小长假男子被流浪猫绊倒 投喂者赔24万小米汽车超级工厂正式揭幕黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发当地回应沈阳致3死车祸车主疑毒驾恒大被罚41.75亿到底怎么缴妈妈回应孩子在校撞护栏坠楼外国人感慨凌晨的中国很安全杨倩无缘巴黎奥运校方回应护栏损坏小学生课间坠楼房客欠租失踪 房东直发愁专家建议不必谈骨泥色变王树国卸任西安交大校长 师生送别手机成瘾是影响睡眠质量重要因素国产伟哥去年销售近13亿阿根廷将发行1万与2万面值的纸币兔狲“狲大娘”因病死亡遭遇山火的松茸之乡“开封王婆”爆火:促成四五十对奥巴马现身唐宁街 黑色着装引猜测考生莫言也上北大硕士复试名单了德国打算提及普京时仅用姓名天水麻辣烫把捣辣椒大爷累坏了

两个鬼故事 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化