• 0

    用户访问量

  • 0

    注册用户数

  • 0

    在线视频观看人次

  • 0

    在线实验人次

语义分析概述
语义分析概述:语义分析,其实就是要识别一句话所表达的实际意义。比如弄清楚“干什么了”,“谁干的”,“这个行为的原因和结果是什么”以及“这个行为发生的时间、地点及其所用的工具或方法”等。对于不同的语言单位,语言分析的任务各不相同:在词的层次上,语义分析的基本任务是进行词义消歧;在句子层面上,语义角色标注是所关心的问题;在文章层次上,指代消解、篇章语义分析是重点。
作者:云创智学 来源:云创智学 发布时间:2022-03-28 10:22:55
自底向上的句法分析
自底向上的句法分析:从分析树的底部向顶部方向构造分析树,是一个从叶结点到根结点的过程。从给定的句子出发,逆向使用产生式规则进行规约,直到把句子规约成语法开始符S为止。从分析树的底部向顶部方向构造分析树,是一个从叶结点到根结点的过程。从给定的句子出发,逆向使用产生式规则进行规约,直到把句子规约成语法开始符S为止。2、自底向上的LR分析器的分析(1)移入:将下一个输入符号移到栈的顶端。(2)规约:根据规则,将栈顶的若干个符号替换成一个符号。(3)接受:句子中所有词语都已移进栈中,且栈中只剩下一个符号S,语法分析成功,完成。(4)拒绝:句子中所有词语都已移进栈中,栈中并非只有一个符号S,也无法进行任何规约操作,分析失败,结束。3、LR分析算法思想(1)输入:待分析的句子w语法G的LR分析表(2)输出:w合法,输出acc否则err4、LR分析算法过程
作者:云创智学 来源:云创智学 发布时间:2022-03-28 10:21:28
自顶向下的句法分析
自顶向下的句法分析:从分析树的顶部向底部方向构造分析树,是一个从根结点到叶结点的过程。由语法开始符s出发,选择合适的产生式规则进行推导,直到推导出句子为止。
作者:云创智学 来源:云创智学 发布时间:2022-03-28 10:19:09
句法分析概述包括
句法分析概述包括:句法分析是对用户输入的自然语言进行词汇短语的分析,目的是识别句子的句法结构,实现自动句法分析过程。分析的目的就是找出词、短语等的相互关系以及各自在句子中的作用等,并以一种层次结构来加以表达。这种层次结构可以是从属关系、直接成分关系,也可以是语法功能关系。句法分析是由专门设计的分析器进行的,其分析过程就是构造句法树的过程,将每个输入的合法语句转换为一棵句法分析树。一个句子是由各种不同的句子成分组成的。这些成分可以是单词、词组或从句。句子成分还可以按其作用分为主语、谓语、宾语、宾语补语、定语、状语、表语等,这种关系可用一棵树来表示。如对句子“妖精抓走了唐僧”,可用图示的树形结构来表示:
作者:云创智学 来源:云创智学 发布时间:2022-03-28 10:18:17
词法的词性标注
词法的词性标注:词性(part-of-speech)是词汇基本的语法属性,通常也称为词性。词性标注(part-of-speechtagging),又称为词类标注或者简称标注,是指为分词结果中的每个单词标注一个正确的词性的程序,也即确定每个词是名词、动词、形容词或者其他词性的过程。词性标注是很多NLP任务的预处理步骤,如句法分析,经过词性标注后的文本会带来很大的便利性,但也不是不可或缺的步骤。
作者:云创智学 来源:云创智学 发布时间:2022-03-25 11:00:52
词法基本分词的方法
词法基本分词的方法:一、基于字符串匹配的方法基于字符串匹配的方法又称为机械分词方法或字典匹配方法,它主要依据词典的信息,按照一定的策略将待切分的汉字串与词典中的词条逐一匹配,若在词典中找到该词条,则匹配成功,否则做其它相应的处理。1、正向最大匹配分词算法所谓词典正向最大匹配就是将一段字符串进行分隔,其中分隔的长度有限制,然后将分隔的子字符串与字典中的词进行匹配,如果匹配成功则进行下一轮匹配,直到所有字符串处理完毕,否则将子字符串从末尾去除一个字,再进行匹配,如此反复。其基本思想是:假设己知机器词典中最长词条的长度为N,则以N作为减字开始的长度标准,首先将待扫描的文本串S从左向右截取长度为N的字符串W1,然后在词典中查找是否存在该字符串W1的词条。如果匹配成功,则W1标记为切分出的词,再从待扫描文本串的N+1位置开始扫描;如果匹配失败,将截取长度减1后,再从S中截取此长度的字符串W1’,重复上述匹配过程,直至截取长度为1为止。以扫描完句子作为整个匹配过程结束。2、逆向最大匹配分词算法逆向最大匹配分词法,其基本思想与正向最大匹配分词法大体一致,只是扫描方向换成了从右至左。换句话说,当扫描汉语句子时,根据词典中最长词条的长度,从句末开始向左截取出汉语字符串与词典中的词条匹配,匹配流程与减字法相同,直至扫描到句首为止。3、双向最大匹配分词算法这种分词算法侧重于分词过程中检错和纠错的应用,其基本原理是对待切分字符串采用正向最大匹配和逆向最大匹配分别进行正向和逆向扫描和初步切分,并将正向最大匹配初步切分结果和逆向最大匹配初步切分结果进行比较,如果两组结果一致,则判定分词结果正确,如果存在不一致,则判定存在着切分歧义,需要进一步采取技术手段来消解歧义。二、基于统计的方法1、隐马尔可夫模型假设我手里有三个不同的骰子。第一个骰子是我们平常见的骰子(称这个骰子为D6),6个面,每个面(1,2,3,4,5,6)出现的概率是1/6。第二个骰子是个四面体(称这个骰子为D4),每个面(1,2,3,4)出现的概率是1/4。第三个骰子有八个面(称这个骰子为D8),每个面(1,2,3,4,5,6,7,8)出现的概率是1/8。2、条件随机场(CRF)它们的区别是:①HMM是有向图,CRF是无向图;②HMM计算的是状态和观测的联合概率,而CRF计算的是状态基于观测的条件概率。③HMM多用于那种状态“原生”,观测是状态“生成”出来的场景。如,用HMM来生成一段语音,则状态对应的是音节(声韵母)或文字,而观测则是这个音节所对应的声学特征。④CRF则多用于那种观测“原生”。状态“后天”产生,用来标记观测的情况。如,用CRF来做文本实体标记。输入一句话“我有一个苹果”,CRF处理后将“苹果”标记成了“水果”。这个时候,“苹果”是观测,而“水果”则是对应的状态。
作者:云创智学 来源:云创智学 发布时间:2022-03-25 10:59:38
词法分析概述
词法分析概述:将输入的句子字串转换成词序列并标记出各词的词性。这里所说的“字”并不仅限于汉字,也可以指标点符号、外文字母、注音符号和阿拉伯数字等任何可能出现在文本中的文字符号,所有这些字符都是构成词的基本单元。不同的语言对词法分析有不同的要求,例如英语和汉语就有较大的差距。例如:“我们研究所有东西”,可以是“我们——研究所——有——东西”也可是“我们——研究——所有——东西”。英语等语言的单词之间是用空格自然分开的,很容易切分一个单词,因而很方便找出句子的每个词汇。例如:“Westudyeverything”,分词结果为“We——study——everything”。
作者:云创智学 来源:云创智学 发布时间:2022-03-25 10:54:43
利用卷积神经网络识别图像
利用卷积神经网络识别图像:实验目的:本实验任务是让我们理解经典的卷积神经网络的模型,并学会处理常见的图像识别任务。Keras是一个神经网络库,可以通过调节大量的超参数,从而创建更好的网络模型。实验内容:1、安装TensorFlow框架,安装Keras框架;2、下载相关数据集:CIFAR图像集和MNIST手写体数据集;3、分别搭建两个卷积神经网络,选择参数;4、训练网络;5、评估模型;6、进行预测。
作者:云创智学 来源:云创智学 发布时间:2022-03-25 10:32:16
深度学习前景展望
深度学习前景展望:现在计算机可以快速自动识别出图像中的各个物体,对于自动驾驶和机器人技术有重要的意义。生成式对抗网络,一种新的深度卷积网络范式,试图模拟人类的创造力和想象力,能自动作画、作曲、写诗,甚至发现治疗癌症的药物结构。AlphaGoZero的最新版已经能够完全脱离人力类棋谱,从零开始,自我博弈,十几天内就超越人类,40天内棋力就能超越最初的AlphaGo,甚至能发现许多人类几千年来不知道的定式。
作者:云创智学 来源:云创智学 发布时间:2022-03-25 10:31:15
卷积神经网络的架构
卷积神经网络的架构:1、概述深度网络基本架构中,层是基本的数据结构,一个数据处理模块,可将层看作深度学习的乐高积木,Keras等框架就是这么做的,构建深度学习模型就是将相互兼容的多个层拼接在一起。网络拓扑结构的选择更像是一门艺术而不是科学,只有动手实践才能成为合格的神经网络架构师。2、LeNet-5是由LeCun等人在1998年发表的,是卷积神经网络的开山之作。LeNet也是第一个成功应用于数字识别问题的卷积神经网络。在MNIST数据集上,LeNet-5模型可以达到大约99.2%的正确率。网络包含了卷积层、池化层、全连接层,这些都是现代卷积网络的基本组件。LeNet-5模型总共有7层,下图展示了LeNet-5模型的结构。
作者:云创智学 来源:云创智学 发布时间:2022-03-24 10:52:05
联系方式
企业微信