-
51信用卡被查引发“爬虫技术”争议 是否侵犯个人信息?
据中国之音报道,最近,“51信用卡”被查事件,让本就处在风口浪尖的大数据风险控制领域,再添一把“火”。业内人士透露,在隐私保护薄弱、数据安全存在漏洞的国内互联网环境中,爬虫技术往往…
-
数据科学:合成数据如何解决匿名化问题?
现在,随着GDPR的生效,企业在保护数据时必须非常小心。传统的匿名通常不是真正的匿名,最终个人身份可以被识别。向数据添加额外匿名级别的一种方法是引入复合数据。 自GDPR EU-数…
-
数据分析师:数据驱动型业务决策的关键角色
数据分析师通过解释大量数据来帮助组织了解业务的当前状态。 什么是数据分析师? 数据分析师使用数据帮助组织做出更好的业务决策。数据分析师使用计算机编程、数学、统计学和其他学科从数据中…
-
改进大数据分析以应对网络安全挑战
为了应对网络安全的挑战和威胁,组织必须改进大数据分析。这就是大数据分析非常重要的原因。 海量存储和移动计算的进步带来了新兴的“大数据”技术。然而,这些技术的进步和发展带来了能够实时…
-
数据及分析的未来是增强分析?
2019年,在澳大利亚悉尼举行的高德纳数据和分析峰会上,高德纳将增强分析作为今年十大战略趋势和总体信息技术十大战略趋势之一推向公众。在高德纳最新的魔力象限(Magic Quadra…
-
区块链与大数据不得不说的互补关系
区块链和大数据是新一代信息技术。它们有不同的概念和不同的应用领域。区块链和大数据也是两种蓬勃发展的技术,也是两种互补的技术。 近年来,区块链技术逐渐成为计算机技术的核心。它是一种加…
-
对PB级非结构化数据的要求
众所周知,非结构化数据很难管理。然而,当组织的非结构化数据资产超过PB阈值时,控制数据集将带来一系列新的挑战。 大多数传统的网络连接存储(NAS)系统难以管理100 TB的非结构化…
-
数据科学中一些不常用但很有用的Python库
当涉及到用于数据科学的python包时,人们会想到numpy、熊猫、scikit-learn等等。在这里,我想介绍一些不常用但非常有用的python包,就像草稿一样。虽然大部分时间…
-
大数据和人工智能如何协同工作
人工智能和机器学习如何帮助组织从大数据中获得更好的商业洞察力?需要知道人工智能和大数据分析的下一步发展。 大数据技术不像几年前那么受欢迎,但这并不意味着大数据技术还没有发展起来。如…
-
使用Spark Streaming SQL进行PV/UV统计
1.背景介绍 光伏/紫外统计是流量分析的常见场景。通过光伏,流量或热点分析可以在被访问的网站上完成。例如,广告商可以通过光伏价值来估计投放广告网页带来的流量和广告收入。其他场景需要…