资源技术动态遗忘算法系列(六):语义模型

遗忘算法系列(六):语义模型

2019-10-31 | |  87 |   0

原标题:非主流自然语言处理——遗忘算法系列(六):语义模型  

来源:CSDN          链接:https://blog.csdn.net/gzdmcaoyc/article/details/79894763


【前言】

1、语义体系的建立对人工智能的意义,相信不用多说。

2、公开此文的目的,是因为此文所设计的语义模型包含的待解决任务量很大,寻求同好共同讨论交流。

3、版权说明

   3.1、本文的版权归作者所有。

   3.2、本文中所提及的问题的解决方案,归研究者所有。



【正文】

============================================================

【原理】

词的语义可以通过与其相关联的词表征


【定义】

词的语义:用该词的词翼及其概率的集合来表示

词翼:该词与其窗口尺寸中互信息大于一定阈值的共现词共同构成


【统计可知】

1、每个词发生的概率

2、任意词对,可知左词发生时右词发生的概率

3、任意词,可知该词的所有词翼及其概率


【公理假设】


1、

问:句子是由词按什么规则构成的?

答:

    1.1、包含算子

        1.1.1、算子指示集合运算的类型

        1.1.2、集合运算包括以下类型等:

            1、等价

            2、交、并、补

            3、属于、包含 

    1.2、不含算子

        1.2.1、并联、串联、嵌套


2、

问:段落是由句子按什么规则构成的?

答:

    2.1、段落中的句子可视为相互独立,相关的部分会重复

    2.2、重复的部分可能会有缺省、使用代词等变体形式

    2.3、缺省、指代可以通过上下文推断获得


3、

问:标题与正文是怎样的关系?

答:

    3.1、标题与正文的语义尽可能相似

    3.2、标题受字数限制


4、

问:对话过程中,问句与答句是什么关系?

答:答句是当问句发生时,可能发生概率最大的句子。


5、

问:祈使句有什么不同?

答:祈使句的应答是行为动作,可以将此类行为动作视为特殊的句子,对标机器人的动作API的函数调用。


【任务目标】

1、句子解析:

    1.1、串、并、嵌套以及算子的识别解析

    1.2、缺省及指代的处理

    1.3、上下文模型



2、已知构成句子各词的语义(词翼及其概率的集合)时,求整个句子的语义。


3、已知语义时,求该语义对应的句子。

    3.1、给文章拟标题


4、已知问句时,求答句。


5、计算两个句子的语义相似度。


6、推理

    6.1、三段论推理

————————————————

版权声明:本文为CSDN博主「gzdmcaoyc」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。

原文链接:https://blog.csdn.net/gzdmcaoyc/article/details/79894763

THE END

免责声明:本文来自互联网新闻客户端自媒体,不代表本网的观点和立场。

合作及投稿邮箱:E-mail:editor@tusaishared.com

上一篇:遗忘算法系列(二):大规模语料词库生成

下一篇:NLP 在企业应用中的实践(一)

用户评价
全部评价

热门资源

  • 应用笔画宽度变换...

    应用背景:是盲人辅助系统,城市环境中的机器导航...

  • GAN之根据文本描述...

    一些比较好玩的任务也就应运而生,比如图像修复、...

  • 端到端语音识别时...

    从上世纪 50 年代诞生到 2012 年引入 DNN 后识别效...

  • 人体姿态估计的过...

    人体姿态估计是计算机视觉中一个很基础的问题。从...

  • 谷歌发布TyDi QA语...

    为了鼓励对多语言问答技术的研究,谷歌发布了 TyDi...