从古时起,记忆作为哲学的研究对象早已开始,众多哲学家对记忆都有一定的思考。关于记忆的界定、记忆的本质、记忆的形而上学、记忆与心灵、记忆与真、记忆与伦理道德等, 一直是对记忆进行哲学剖析必须面对的问题,同时,这些领域也构成了记忆哲学的研究框架。随着数据科学与技术的发展,数据成为人类社会的一个重要基质, “数据主义”“万物皆数”“数据永生”等凸显数据科技强大效力的词汇悄然而至,延展记忆、外部记忆、记忆工业化、第三记忆等与记忆相关的词汇也逐渐进入哲学领域。 数据科学与技术不仅可以记录人类的一切,还可以构建数据自然界。
2022-12-28
数据湖(Data Lake),湖仓一体(Data Lakehouse)俨然已经成为了大数据领域最为火热的流行词,在接受这些流行词洗礼的时候,身为技术人员我们往往会发出这样的疑问, 这是一种新的技术吗,还是仅仅只是概念上的翻新(新瓶装旧酒)呢?它到底解决了什么问题,拥有什么样新的特性呢?它的现状是什么, 还存在什么问题呢?Data Lakehouse(湖仓一体)是新出现的一种数据架构,它同时吸收了数据仓库和数据湖的优势,数据分析师和数据科学家可以在同一个数据存储中对数据进行操作, 同时它也能为公司进行数据治理带来更多的便利性。那么何为Data Lakehouse呢,它具备些什么特性呢?
2022-12-27
人工智能技术应用专业紧扣国家产业发展而诞生。据最新数据显示,截至2022年底,我国人工智能产业在技术创新、产业生态、融合应用等方面取得积极进展,已进入全球第一梯队, 2022年我国人工智能核心产业规模达5080亿元。在国家十四五规划和2035愿景目标中,提出要加强对大数据、人工智能等新兴产业的支持。 同时,人工智能方面的人才缺口也随之急速扩大,数据显示,我国人工智能人才目前缺口超过500万,国内的供求比例为1:10,供需比例严重失衡。 这意味着,人工智能技术应用专业的人才需求将继续高速增长,将为未来的就业市场提供广阔的发展空间。
2022-12-26
近年来,AI技术蓬勃发展,5G网络建设不断推进,如何利用前瞻技术协同各专业实现运维的智能转型成为运营商面临的重大挑战之一。面对复杂的四代共生网络和海量设备, 广东联通致力于推进多个AI创新项目的研究及落地应用,成功为市场线提供快速支撑。 其构建了不同的机器学习模型,对承载网、核心网、无线网、主机等网络的多个黄金性能指标进行自学习自监控,能够指导运维人员提前发现特大隐患及故障, 打破专业壁垒,并辅助网络变更等工作顺利开展。本文阐述了广东联通利用机器学习在网络性能预测中的应用进展,重点等三种时间序列预测模型和相应的阈值设定方法。
2022-12-25
随着人口红利衰退,过去分散割裂的企业经营形态弊端日益凸显。面对产业变革的冲击,很多企业意识到,要谋求更长远的发展,必须向效率要红利,拥抱产业互联网和数字化。 在数字产业方面,“全域数据融合,重构企业的运营模式”这一大的趋势备受关注,具体价值体现在以下几个方面:一提高产业运作效率:汇总与融合企业内部和外部数据,打破了过去模块分化的数据隔阂问题。 二提高市场洞察力:通过消费市场的数据,了解最真实的市场需求,提高营销的精准度。三提高企业经营管理效率:通过提升数据分析处理能力,改变传统经营管理模式。
2022-12-27
“东数西算”中的“数”,指的是数据,“算”指的是算力,即对数据的处理能力。数据、算力和算法是数字经济时代的关键资源,数据是新的生产资料,算力是新生产力,算法是新的生产关系。 在全国数据中心一体化布局的思想指导下,国家发展改革委等巧妙地把“东数西算”的思路上升到国家世纪工程的高度,在尽快实现全国大数据中心一体化协同创新的要求方面,给出了高质量解决方案。 我国东部算力需求高涨但电力资源有限、电价高,而西部电力资源丰富价格低但算力需求不足。为了解决这个矛盾,把东部的数据处理和计算需求搬到西部去,在西部算完之后把结果再传回东部。 “东数西算”工程的首先是如何合理调配和组织东部计算需求,调度西部的最优算力资源为东部计算需求服务,既高效满足东部计算需求,又降低功耗和计算成本,并拉动西部经济发展。
2022-12-23
当前,数据治理对于企业组织机构而言愈发重要。企业不仅需要遵守诸如通用数据保护条例之类的新法规,而且它们最终将认识到数据作为一种资产的价值,需要对其进行保护、管理和维护,以增加资产价值。 数据是数字化转型平台的命脉。数据流动并贯穿于从情报搜集到应用的整个无限循环的过程。应用于业务操作层的情报洞察, 为进一步的情报处理生成更多的数据信息,这些信息随即被转化为行动,而行动又会生成更多的数据,如此循环往复。图1显示的是IDC数字化转型平台中的连续的循环数据流概况。 数据治理是组织涉及数据使用的一整套行为规范,它能够在维护、控制和保护数据资产的同时,将正确的数据交付到正确的资源。此外,数据治理通过对员工、流程、 策略、架构和技术的管控,以实现与公司战略保持一致的目的。当数据治理实施得当时,数据的完整性会提高,在数字化转型过程中获得成功的几率也会增加。
2022-12-25
深度学习是基于人工神经网络和表示学习的一系列机器学习方法的一部分。学习可以是有监督的、半监督的或无监督的,甚至强化学习的。 而人工神经网络是一种非线性统计建模工具,可以用于发现输入和输出之间的关系,或在大型数据库中发现模式。人工神经网络已应用于统计模型开发、自适应控制系统、数据挖掘模式识别和不确定性下的决策。 人工神经网络包含输入层和输出层之间的隐藏层。传统的神经网络只包含一个或几个隐藏层。深度学习是一个非常大的神经网络,包含多得多的隐藏层,它们可以存储和处理更多信息。这是深度学习有别于传统神经网络的最重要的一点。因此,名称“深层”用于此类网络。 深度学习不需要手工提取特征,而直接将图像作为输入。这是深度学习有别于传统神经网络的另一点。
2022-11-25
数据处理技术为各行各业的业务解决了海量存储和分析的需求,但数据量的爆发式增长、数据类型的不断丰富,对数据处理技术和时效性都提出了更高的要求, 这使得通用计算引擎(如Spark、Flink)、交互式分析系统(如ClickHouse)、数据湖框架(如Iceberg)等技术快速发展。 相较于其他数据系统,数据湖主要区别有以下几点: 易用,数据湖可以存储不同来源、不同类型的数据,方便进一步分析和重新安置;组织和结构化,数据是以原始格式进行实时收集和存储; 实惠,能为任何规模的数据提供划算的价格;适用于任何时间框架,可以实时或按需更新;无限存储空间,为大数据存储提供优秀的解决方案。
2022-11-20