作者文章归档:钟琦玲

探码之名,源自探马, 指先锋。蒙古帝国时期,从各千户、百户和部落中拣选士兵,组成精锐部队,在野战和攻打城堡时充当先锋,战事结束后驻扎镇戍于被征服地区,称为探马赤军。
将’马’改为’码’,即代码、二维码,意为科技公司,我们将用高效的代码,筑就梦想,改变生活。

中国大数据产业地图,四川61家大数据企业上榜!


数据来源于:2018中国大数据创新企业TOP100

由DT大数据产业研究院绘制的中国大数据产业地图,涵盖数据源、基础架构、领域服务、行业应用等多个大类的各个垂直领域。除此之外,还包括产业联盟、研究机构、教育机构、大数据媒体、大数据社区等周边支撑服务,覆盖了中国大数据产业生态链上的各个重要环节。2018DTiii版中国大数据产业地图继续深化,根据多个产业数据库、投资库的收录从上千家企业中遴选659家,最终形成涵盖2233家的新版产业地图。

新版产业地图中涵盖中国全部省份/地区,其中上榜企业数量排名前十的省份/地区为,北京997家、上海336家、深圳1...

Read more

大数据经历了40年的发展,传统数据和网络大数据存在哪些不同?


文章来源:探码科技

从“大数据”一词的正式出现距今已经将近40年的时间,现如今,互联网成为大数据三大来源之一,是获取、传播和扩散相关信息的重要渠道。作为主要数据类型,如今的网络大数据都有哪些特点?本文将通过传统数据与网络数据的对比,探讨网络大数据的特征。

传统数据和网络大数据的区别

结构化数据和非结构化数据

传统行业更多的是结构化数据,存储在数据库里,可以用二维表结构来逻辑表达实现的数据,像以应用oracle、Sql Server等数据库的制造型企业的ERP系统。而网络大数据更多的是非结构化数据,就是不能以二维形态描述的,例如所有格式的办公文档、文本、图片...

Read more

大数据应用案例:数据画像不只“用户画像”


文章来源:探码科技

随着消费互联网的不断深入,不可避免的给企业及消费者行为带来一系列改变与重塑。其中最大的变化莫过于,消费者的一切行为在企业面前似乎都将是“可视化”的。随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据来为精准营销服务,进而深入挖掘潜在的商业价值。于是,“用户画像”的概念也就应运而生。

然而,“用户画像”仅仅是数据应用的一个方向,在对大数据画像的应用上,除了“用户画像”我们来看看还有哪些数据画像的应用案例。

市场监管:非法行为无处遁形

不久...

Read more

总结|财富500强公司都会采集哪些网络数据


文章来源:探码科技

Mozenda销售与营销副总裁Kaleb Mangum在YouTube上发表了“How To Leverage Web Data To Beat The Competition: Successful Use Cases From The Fortune 500”视频,讲述了财富500强企业如何利用网络数据增加竞争力,本文将总结视频中的主要内容,和大家一起看看财富500强企业都采集哪些网络数据

位置数据

无论你是在寻找商机、增长机会还是市场调研,了解你的竞争环境都是至关重要的。我们已经看到财富500强企业以几种不同的方式做到...

Read more

以真实事件举例,探讨政企监测网络舆情数据是否必要


文章来源:http://www.tanmer.com/web-bigdata

真实网络舆情事件

10月5日,正随队在东京的美国NBA休斯顿火箭队总经理莫雷针对香港事态发了一条推特“为自由而战,和香港在一起”的图片,这是香港示威所采用的口号,迅速引发各界关注。此后,NBA总裁肖华回应此事称支持莫雷言论自由,再度引爆舆论。

此网络舆情事件的影响

 

  • 我国驻休斯敦总领馆立即向火箭队提出严正交涉,要求该队作出澄清,纠正错误,采取切实措施,消除恶劣影响。
  • 中国篮协也第一时间对莫雷的言论表示强烈反对,并暂停与该俱乐部的交流合作事宜...

Read more

一款可以精准爬取网站的网络数据采集系统


文章来源:探码科技

利用网络大数据面临的挑战

互联网上有浩瀚的数据资源,要想抓取这些数据就离不开爬虫。鉴于网上免费开源的爬虫框架多如牛毛,很多人认为爬虫定是非常简单的事情。但是如果你要定期、上规模地准确抓取各种大型网站的数据却是一项艰巨的挑战。流行的爬虫框架Scrapy开发者Scrapinghub在抓取了一千亿个网页后,总结了他们在爬虫是遇到的挑战

  • 速度和数据质量:由于时间通常是限制因素,规模抓取要求你的爬虫要以很高的速度抓取网页但又不能拖累数据质量。对速度的这张要求使得爬取大规模产品数据变得极具挑战性。
  • 网站格式多变:网页本身是基于HTML这种...

Read more

通过网络数据采集系统快速获得优质销售线索


文章来源:探码科技

销售线索的重要性

每笔交易都是从销售线索开始的。 有了销售线索,就有了销售机会,才会有成交机会。实际上,有61%的B2B营销人员认为产生高质量的潜在客户是他们最大的挑战(IDG)之一,并且68%的企业报告在产生潜在客户方面遇到困难。大部分公司通过一些老方法 -内容营销,电子邮件,社交媒体,PPC广告等等来获得线索。这些方法都产生了不错的效果,但是他们确实花费了大量的时间成本和沉默成本。

探码网络数据采集系统通过网络爬虫的方法,会广泛挖掘网络上公司和个人的公开数据,以及他们的需求。对挖掘的数据进行整理、归类、对齐、标准化,分析标签化画像,建立个性化的推荐模...

Read more

网络公开金融数据采集分析,提高行业数据洞察力


文章来源:探码科技

金融业的数据浪潮

随着大数据技术的应用,越来越多的金融企业也开始投身到大数据应用实践中。麦肯锡的一份研究显示,金融业在大数据价值潜力指数中排名第一。以银行业为例,中国银联涉及43亿张银行卡,超过9亿的持卡人,超过一千万商户,每天近七千万条交易数据,核心交易数据都超过了TB级。一直以来,金融企业对数据的重视程度非常高,通过提高数据洞察力做出经过良好评估的投资决策。

金融数据的类型

金融大数据从数据类型上进行划分,大致可以分为基本面数据、市场数据与分析数据和另类数据四大类。金融行业是各行业中最依赖数据的行业,并且最容易实现数据的变现。

  • 基本面...

Read more

从网络非结构化数据抓取到利用,你需要明白的5个要点!


文章来源:探码科技

数据就是财富,正如“哈佛商业评论”最近报道的那样:“数据正不断的优化我们的思维决策,它在产品开发、销售、招聘与营销决策中发挥着至关重要的作用。”

数据驱动决策

越来越多的公司将自己定位为数据驱动的企业,数据在企业客观衡量财务和运营结果方面表现得越来越好。特别是,在数据驱动决策制定中,行业前三分之一的公司平均比竞争对手高出5%的生产率和6%的盈利能力。

为什么?简单地说......因为他们掌握了大量有价值结构化的数据“ 在决策分析上数据超越了人类的直觉,使人们能作出更加符合商业发展...

Read more

探码网络大数据之网络舆情方案解析


文章来源:探码科技
随着计算机网络的不断变化发展,更便捷的信息分享模式促使网络成为了民意的重要传播渠道,也成为了舆情形成和发展的重要载体。 什么是网络舆情。

 

什么是网络舆情

“网络舆情是以网络为载体,以事件为核心,广大网民情感、态度、意见、观点的表达、传播与互动,以及后续影响力的集合。”一个好的舆情可以树立积极向上的形象,而一个坏的舆情则能让你辛辛苦苦积累起来的形象瞬间崩塌,成为众矢之的,例如:关于某东CEO“性侵”事件,一天内蒸发了142亿,且个人形象收到严重的影响。

负面舆情的危害

舆情事件的产生及发酵,都会引...

Read more