商业帝国的水源:流数据Data stream


  察先机 早布局 商业帝国版图 2

  水是万物之首。——布来基

  这说的是人类生存世界的水!

  生命离不开水,生活、生产离不开水,4.0时代,水资源依旧是生命之源!

  但对商业帝国而言,还有另外一个“水”资源——流数据Data stream!

       此乃发展根基,绝对要一手掌握,且源源不断,势如大江!绝不能容忍他人染指,或仰人鼻息,讨之,买之!

  此处,其含义兼具“流数据”与“数据流”特性。也是关乎个人生存,民族发展的生命之“水”。

  何谓流数据Data stream?

  一般情况下,数据流可被视为一个随时间延续而无限增长的动态数据集合。是一组顺序、大量、快速、连续到达的数据序列,应用于网络监控、传感器网络、航空航天、气象测控和金融服务等领域。

  流数据包括多种数据,例如客户使用您的移动或 Web 应用程序生成的日志文件、网购数据、游戏内玩家活动、社交网站信息、金融交易大厅或地理空间服务,以及来自数据中心内所连接设备或仪器的遥测数据。

  此类数据需要按记录或根据滑动时间窗口按顺序进行递增式处理,可用于多种分析,包括关联、聚合、筛选和取样。借助此类分析得出的信息,公司得以深入了解其业务和客户活动的方方面面,例如服务使用情况(用于计量/计费)、服务器活动、网站点击量以及设备、人员和实物的地理位置,从而迅速对新情况做出响应。例如,公司可以持续分析社交媒体流,从而跟踪公众对其品牌和产品的看法的变化,并在必要时及时做出反应。 [1] 

  流数据具有四个特点:

  1)数据实时到达;

  2)数据到达次序独立,不受应用系统所控制;

  3)数据规模宏大且不能预知其最大值;

  4)数据一经处理,除非特意保存,否则不能被再次取出处理,或者再次提取数据代价昂贵。

  流数据在网络监控、传感器网络、航空航天、气象测控和金融服务等应用领域广泛出现,通过对流数据研究可以进行卫星云图监测、股市走向分析、网络攻击判断等。 [2] 

  流数据示例

  1. 交通工具、工业设备和农业机械上的传感器将数据发送到流处理应用程序。该应用程序再监控性能,提前检测任何潜在缺陷,自动订购备用部件,从而防止设备停机。

  2. 一家金融机构实时跟踪股市波动,计算风险价值,然后根据股票价格变动自动重新平衡投资组合。

  3. 一家房地产网站跟踪客户移动设备中的一部分数据,然后根据其地理位置实时建议应走访的房产。

  4. 一家太阳能发电公司必须维持可满足客户需求的发电量,否则就要支付罚金。该公司实施了一个流数据应用程序,用以监控电力系统中的所有电池板,并实时调度服务,从而最大限度缩短了每个电池板的低产能期,也因此减少了相关的罚款支出。

  5. 一家媒体出版商对数十亿的在线内容点击流记录进行流处理,利用有关用户的人口统计信息汇总和丰富数据,并优化网站上的内容投放,从而实现关联性并为受众提供更佳的体验。

  6. 一家网络游戏公司收集关于玩家与游戏间互动的流数据,并将这些数据提供给游戏平台,然后再对这些数据进行实时分析,并提供各种激励措施和动态体验来吸引玩家。

  何谓数据流(data stream)

  最初是通信领域使用的概念,代表传输中所使用的信息的数字编码信号序列。然而,我们所提到的数据流概念与此不同。这个概念最初在1998年由Henzinger在文献87中提出,他将数据流定义为“只能以事先规定好的顺序被读取一次的数据的一个序列”。

  以上参照百度百科词条

  其实这两个概念,云计算都已经涉及,之所以提出来,是为了强调她们的“第一手”特征!因为其“第一手”的许多特征,例如价值密度低、分布不规律、信息程度深等特征,太多的奥妙,是目前尚无法发现的,是需要留给后来者研发的!

  欲致鱼者先通水,欲致鸟者先树木。——汉·刘安《淮南子·说山训》

  现在就是需要占领“水源”的时候!

  题外话:我们每个人都像一头负重前行的牛,因为弓着背、低着头,所以即使自我感觉头高高仰起来了,但实际上高度有限,所以免不了也目光有限。

  优点是否就是缺点?

  角度、方向存在偏差时的领先,是否是未来的一种落后?

  参考资料

    1.  什么是流数据?  .amazon[引用日期2017-05-02]