• 0

    用户访问量

  • 0

    注册用户数

  • 0

    在线视频观看人次

  • 0

    在线实验人次

自然语言的语义网络
语义网络是一种词法知识的表示方法,由带标记的链和带标记的节点组成的图。节点表示词义,链表示节点之间的语义关系。典型词汇关系信息库有:WordNetConceptNetFrameNet
作者:云创智学 来源:云创智学 发布时间:2022-04-29 13:20:11
自然语言的语义分析
判断一句话的意思要分两步来进行:首先,计算出它上下文无关的标记形式,称之为逻辑形式(logicalform);然后,在上下文中对逻辑形式进行解释,生成最终的意义表示。对上下文无关意义的研究称为语义学。对上下文相关语言的研究称为语用学。
作者:云创智学 来源:云创智学 发布时间:2022-04-29 13:19:18
自然语言的浅层句法分析
浅层语法分析(shallowparsing)也称为局部语法分析(partialparsing),处理层次可分为:词短语句子常见的浅层语法分析主要有两类:基于统计基于规则基于规则的方法就是根据人工书写的或半自动获取的语法规则标注出短语的边界和短语的类型。规则的使用相对简单,但是规则的获取却比较困难。
作者:云创智学 来源:云创智学 发布时间:2022-04-29 13:18:24
自然语言的上下文无关语法
上下文无关语法(Context-FreeGrammar,简称CFG),上下文无关语法又称为短语结构语法(Phrase-StructureGrammar),由规则(rule)以及词表(lexicon)构成。Chomsky层次语法理论:
作者:云创智学 来源:云创智学 发布时间:2022-04-29 13:17:26
自然语言的词类和词类标注
词类又称为POS(Part-of-Speech)能够提供关于单词及其邻近成分的信息。词类标注(Part-of-Speechtagging或POStagging),简称标注,指给语料库中的单词指派词类标记的过程。这些标记也用来标注标点符号,因此自然语言的标注过程与计算机语言的词例还原(tokenization)过程是一样的。英语词类标注中的常用标记集:PennTreebank的标记集包含45个标记,是小标记集;CLAWS(theConstituentLikelihoodAutomaticWord-taggingSystem)使用的标记集C5包含61个标记,是中型的标记集,用于标注英国国家语料库(theBritishNationalCorpus,简称BNC);第三个标记集是包含146个标记的大型标记集C7。
作者:云创智学 来源:云创智学 发布时间:2022-04-28 13:23:25
自然语言的句法处理
句法(syntax)是指把单词和词组安排在一起怎样形成句子的方法。单词是语言处理的单元,句法是骨架,句法研究单词之间的形式关系。单词可以类聚为词类(part-of-speech),或者与相邻的单词组合成短语。PetergavethebooktoAna.(彼得把这本书给了安娜。)ThebookwasgiventoAnabyPeter.(这本书被彼得给了安娜。)句子的结构并不反映句子的意义,相同的句法结构,在不同的环境下,具有不同的意义。
作者:云创智学 来源:云创智学 发布时间:2022-04-28 13:22:08
自然语言自动机转换正则表达式
1、正则表达式(regularexpression,简称RE)是字符文本序列的标准记录方式,是一种用于描述文本搜索符号串的语言,广泛应用于各类信息检索中。2、有限状态自动机(finite-stateautomaton,简称FSA)能够而且只能够生成或识别满足形式语言定义所要求的形式语言的字符串。3、示例,五个状态:节点0是初始状态(startstate),节点4是最后状态(finalstate),用双圆圈表示,另外还有4个转移(transition),用箭头线表示。
作者:云创智学 来源:云创智学 发布时间:2022-04-28 13:20:26
自然语言处理需要兼顾哪些不同平面的知识
自然语言处理(NaturalLanguageProcessing,简称NLP)需要兼顾到不同平面的知识:1、词汇学,描述词汇系统的规定说明单词本身固有的语义特性和语法特性;2、句法学,根据单词和词组之间的结构规则说明单词和词组怎样形成句子;3、语义学,描述句子中各个成分之间的语义关系,这样的语义关系是与情境是无关的;4、语用学,描述与情境有关的情景语义,说明怎样推导出句子具有的与周围话语有关的各种涵义。每个层面具备自身的特点:词汇学主要描述具体的单词的构成成份,如语素、屈折变化形式等;句法学涉及的是词和词组怎样组成句子的知识;语义学指的是给句子指派意义;语用学则涉及在对话中话语焦点的转移以及在给定的上下文中解释句子的含义。
作者:云创智学 来源:云创智学 发布时间:2022-04-28 13:18:07
GMM-HMM在语音识别上的原理
下面简明讲述GMM-HMM在语音识别上的原理,建模和测试过程。为了便于读者理解,以一个词的识别全过程作为例子。1、将声波分割成等长的语音帧,对每个语音帧提取特征(例如,梅尔频率倒谱系数)2、对每个语音帧的特征进行GMM训练,得到每个语音帧frame(o_i)属于每个状态的概率3、根据每个单词的HMM状态转移概率计算每个状态序列生成该语音帧的概率。哪个词的HMM序列计算出来的概率最大,就判断这段语音属于该词)
作者:云创智学 来源:云创智学 发布时间:2022-04-28 13:13:50
图像标注的技术有哪些
1.基于深度网络的图像标注方法概述图像标注是由计算机以说明或关键词的形式分配语言数据给一张图像的过程。2.视觉语义对齐视觉和语义的对齐模型主要由三个部分组成视觉表示:构造卷积神经网路(ConvolutionNeuralNetwork,CNN),用于表示图像区域语义表示:构造双向循环神经网络(BidirectionalRecurrentNeuralNetworks),用于表示语句视觉语义对齐:构造结构化的目标函数,使用多模态嵌入方法将图像区域与语义进行对齐3.为新图像生成对应文本描述假定我们有一些图像和相关语句描述的集合,这些集合可以是整幅的图像和相关的语句描述,也可以是图像区域和相关的语句片段。主要的挑战是设计一个模型,使之可以根据给定的新图像预测相对应的文本描述。
作者:云创智学 来源:云创智学 发布时间:2022-04-27 10:11:37
联系方式
企业微信