热门标签: 美国大学
2024-08-21 阅读量:152 留美汇
自然语言处理(Natural Language Processing,NLP)是人工智能(Artifcial Intelligence,AI)的一个分支,它使计算机能够理解、生成和操纵人类语言。自然语言处理能够用自然语言文本或语音查询数据这也被称为“语言输入”
自然语言处理(NLP)定义
大多数消费者可能在没有意识到的情况下已经与 NLP 进行了交互。例如,NLP 是虚拟助手(如 Oracle数字助手(Oracle Digital Assistant,ODA)、Siri、Cortana 或 Alexa)背后的核心技术。当我们向这些虚拟助手提问时,NLP 使它们不仅能够理解用户的请求,还能够以自然语言进行回应。NLP 适用于书面文本和语音,并且可以应用于所有人类语言。由 NLP 驱动的其他工具示例包括网络搜索、电子邮件垃圾邮件过滤、文本或语音的自动翻译、文档摘要、情感分析和语法/拼写检查。例如,一些电子邮件程序可以根据邮件内容自动建议适当的回复 -- 这些程序使用 NLP 来读取、分析和回复你的邮件。
还有几个其他术语与 NLP 大致同义。自然语言理解(Natural Language Understanding,NLU)和自然语言生成(Natural Language Generation,NLG)分别指使用计算机理解和产生人类语言。NLG 能够通过使用称为“图形语法”的概念将有意义的信息总结为文本来提供对所发生事情的口头描述。这也被称为“语言输出”
在实践中,NLU 被用来表示 NLP。计算机对所有人类语言的结构和意义的理解,允许开发人员和用户使用自然句子和交流与计算机进行交互。计算语言学(Computational Linguistics,CL)是研究人类语言计算方面的科学领域,而 NLP 是关注构建理解、生成或操纵人类语言的计算制品的工程学科。对 NLP 的研究在 20 世纪 50 年代数字计算机发明后不久就开始了,NLP 借鉴了语言学和人工智能。然而,过去几年的重大突破是由机器学习推动的,机器学习是人工智能的一个分支,它开发从数据中学习和泛化的系统。深度学习是一种机器学习,它可以从大型数据集中学习非常复杂的模式,这意味着它非常适合从网络来源的数据集中学习自然语言的复杂性。
二、自然语言处理的应用
自动化日常任务:由 NLP 驱动的聊天机器人可以处理当今由人工代理处理的大量日常任务,使员工能够从事更具挑战性和有趣的任务。例如,聊天机器人和数字助手可以识别各种用户请求,将它们与公司数据库中的适当条目匹配,并为用户制定适当的回复。改进搜索:NLP 可以通过基于上下文消除词义歧义(例如,“carrier”在生物医学和工业语境中有不同的含义)、匹配同义词(例如,在搜索“automobile”时检索提到“car”的文档)以及考虑词形变化(这对于非英语查询很重要)来改进文档和常见问题检索的关键词匹配搜索。有效的由 NLP 驱动的学术搜索系统可以极大地改善医生、律师和其他专业人员对相关前沿研究的访问。搜索引擎优化:NLP 是通过分析搜索以优化你的内容从而使你的业务在在线搜索中排名更高的好工具。搜索引擎使用 NLP 对其结果进行排名 -- 并且知道如何有效地使用这些技术可以使你更容易在竞争对手之上排名。这将为你的业务带来更大的知名度。分析和组织大型文档集合:文档聚类和主题建模等 NLP 技术简化了理解大型文档集合(如公司报告、新闻文章或科学文档)中内容多样性的任务。这些技术通常用于法律发现目的。社交媒体分析:NLP 可以分析客户评论和社交媒体评论,以更好地理解大量信息。情感分析识别社交媒体评论流中的正面和负面评论,实时提供客户情感的直接度量。这可以带来巨大的回报,例如提高客户满意度和收入。
市场洞察:随着 NLP 分析你业务的客户的语言,你将更好地了解他们想要什么,并且也更好地了解如何与他们沟通。面向方面的情感分析检测社交媒体中与特定方面或产品相关的情感(例如,“键盘很棒但屏幕太暗”),为产品设计和营销提供直接可操作的信息。
内容审核:如果你的业务吸引了大量用户或客户评论,NLP 使你能够审核所说的内容,以便通过分析评论的词语、语气和意图来保持质量和文明。
三、使用自然语言处理的行业
NLP 简化并自动化了广泛的业务流程,尤其是涉及大量非结构化文本的流程,如电子邮件、调查、社交媒体对话等。借助 NLP,企业能够更好地分析其数据以帮助做出正确的决策。以下只是 NLP 实际应用的几个例子:
医疗保健:随着世界各地的医疗保健系统转向电子病历,他们遇到了大量非结构化数据。NLP 可用于
分析并从健康记录中获得新的见解。
法律:为准备一个案件,律师通常必须花费数小时检查大量文档集合并搜索与特定案件相关的材料。NLP 技术可以自动化法律发现过程,通过筛选大量文档减少时间和人为错误。金融:金融世界变化极快,任何竞争优势都很重要。在金融领域,交易员使用 NLP 技术从公司文档和新闻稿中自动挖掘信息,以提取与他们的投资组合和交易决策相关的信息客户服务:许多大公司正在使用虚拟助手或聊天机器人来帮助回答基本的客户询问和信息请求(如常见问题解答),在必要时将复杂问题转交给人类。
保险:大型保险公司正在使用 NLP 来筛选与索赔相关的文档和报告,以努力简化业务处理方式。
四、NLP 技术概述
NLP 的机器学习模型:我们前面提到,现代 NLP 在很大程度上依赖于一种称为机器学习的人工智能方法。机器学习通过对数据集中的示例进行泛化来进行预测。这个数据集称为训练数据,机器学习算法在这个训练数据上进行训练以产生完成目标任务的机器学习模型。例如,情感分析训练数据由句子及其情感(例如,积极、消极或中性情感)组成。一种机器学习算法读取这个数据集并产生一个模型,该模型将句子作为输入并返回它们的情感。这种将句子或文档作为输入并返回该输入的标签的模型称为文档分类模型。文档分类器也可以用于根据文档提到的主题对文档进行分类(例如,分为体育、金融、政治等)。