人工智能系统的交互过程更像人类,这让一些人感到不舒服,但人工智能并不是为了取代人类。事实上,它更多的是关于从人类身上移除机器人。人工智能的很大一部分价值在于人工过程的自动化和对大量数据的快速分析,以便人类能够自由地完成需要理性和判断的高级任务。然而,为了实现这一点,人工智能系统必须能够与用户通信并分析自然形式的数据(也称为非结构化数据),所有自由流动的数据都不能以整洁的方式打包,例如语音、图像和文本。
非结构化数据对人工智能系统的发展至关重要。人工智能系统与用户沟通得越好,它就越能自主学习。因此,其效率更高。这很重要,因为如果人工智能系统只要求用户以结构化的格式进行交互,那么它的组件将会受到极大的限制。为了人工智能的成功,它必须理解混乱的信息。
在这种情况下,有必要深入了解非结构化数据是如何工作的。
非结构化数据的挑战
在人类世界中,当人们说话时,如果他们没有按照礼节说话。也许任何事情都会出现在我们的脑海中,以某种可能遵循也可能不遵循惯例的形态出现。人们可能会使用俚语、讽刺和笑话。人们把他们希望传达的日常语言和信息组织成整齐的行列是不自然的。语言本身是非结构化的。
如果人们曾经与亚马逊的阿列克谢互动过,他们会知道,虽然Echo系统通常非常理解自由形式的命令,但是缺乏定义好的协议有时会导致问题,或者至少当阿列克谢试图回答时,会产生幽默的反应。查询不适用于模具。亚马逊投入了大量资源和数百万美元来创建和永久改进算法,以使这种类似人类的声音能够响应命令,但阿列克谢仍然存在缺陷,因为Echo擅长解释自由流动的语言。
Alexa的例子强调了非结构化数据的复杂性。人工智能系统处理和创建等同于文本的数字的能力也是一个很高的要求,尤其是当企业考虑到细微差别和场景的重要性时。想象一下,一台机器试图“理解”在一个家庭度假期间照片中发生的事情,或者一幅关于印象主义的艺术史教科书中的图像。
处理非结构化数据的复杂性可能是企业人工智能的最大障碍。然而,它们并非不可逾越。
专业知识的重要性
非结构化数据本身就是噪音。因此,需要大量的专业知识来突破、整理和检测模式,然后开发模型来识别这些模式。数据科学家正在积极推动人工智能系统的改进。最大的成功表明人类的本能和经验是必要的。这通常发生在团队专注于非常狭窄的人工智能应用的时候。
以员工的索赔流程为例,对声明有深入了解的数据科学家团队可以根据他们发现的关键指标创建预测模型。它们包含非结构化数据,如诊断、药物信息、索赔记录等。在这样做时,人工智能系统评估早期指标,并确定索赔可能被拒绝。然后,它可以向用户提供警报。索赔代表可以找出如何进行干预,并对具体索赔给予更多关注,以防止索赔人的律师参与(通常被驳回的索赔最终会涉及律师,这可能会变得非常昂贵,需要很长时间才能解决)。
在这种情况下,很容易看出人工智能系统是如何为用户提供帮助的,并且当合并非结构化数据时,与单独依赖结构化数据相比,精确度大大提高。在非结构化数据(例如,关于共病的信息)中,有一个信息和洞察力的金矿,无法始终如一地找到输入结构化数据的方法。每次添加一条信息,人工智能系统就会变得更加智能,结果也会得到改善。这将提高效率并降低索赔成本。
这只是将非结构化数据纳入企业人工智能系统的好处的一个例子。破解代码需要时间和精力,但回报正在获得前所未有的洞察力——,这可以在几分钟或几小时内获得,而不是几天或几周。
非结构化数据是关键
展望未来,这是显而易见的
尽管非结构化数据具有挑战性,但亚马逊、谷歌、苹果和其他公司为人工智能应用提供了许多机会。人们可以利用这些进步,并将它们应用到具有巨大业务影响的企业应用程序中。
通过花时间应用专业知识和可靠的数据科学,人们可以取得重大突破。人们不仅要通过非结构化数据提高数据分析的准确性,还要在未来实现基本的新思维、沟通和信息利用。
极牛网精选文章《非结构化数据在人工智能中的作用》文中所述为作者独立观点,不代表极牛网立场。如有侵权请联系删除。如若转载请注明出处:https://geeknb.com/3754.html