原标题:非主流自然语言处理——遗忘算法系列(六):语义模型
来源:CSDN 链接:https://blog.csdn.net/gzdmcaoyc/article/details/79894763
【前言】
1、语义体系的建立对人工智能的意义,相信不用多说。
2、公开此文的目的,是因为此文所设计的语义模型包含的待解决任务量很大,寻求同好共同讨论交流。
3、版权说明
3.1、本文的版权归作者所有。
3.2、本文中所提及的问题的解决方案,归研究者所有。
【正文】
============================================================
【原理】
词的语义可以通过与其相关联的词表征
【定义】
词的语义:用该词的词翼及其概率的集合来表示
词翼:该词与其窗口尺寸中互信息大于一定阈值的共现词共同构成
【统计可知】
1、每个词发生的概率
2、任意词对,可知左词发生时右词发生的概率
3、任意词,可知该词的所有词翼及其概率
【公理假设】
1、
问:句子是由词按什么规则构成的?
答:
1.1、包含算子
1.1.1、算子指示集合运算的类型
1.1.2、集合运算包括以下类型等:
1、等价
2、交、并、补
3、属于、包含
1.2、不含算子
1.2.1、并联、串联、嵌套
2、
问:段落是由句子按什么规则构成的?
答:
2.1、段落中的句子可视为相互独立,相关的部分会重复
2.2、重复的部分可能会有缺省、使用代词等变体形式
2.3、缺省、指代可以通过上下文推断获得
3、
问:标题与正文是怎样的关系?
答:
3.1、标题与正文的语义尽可能相似
3.2、标题受字数限制
4、
问:对话过程中,问句与答句是什么关系?
答:答句是当问句发生时,可能发生概率最大的句子。
5、
问:祈使句有什么不同?
答:祈使句的应答是行为动作,可以将此类行为动作视为特殊的句子,对标机器人的动作API的函数调用。
【任务目标】
1、句子解析:
1.1、串、并、嵌套以及算子的识别解析
1.2、缺省及指代的处理
1.3、上下文模型
2、已知构成句子各词的语义(词翼及其概率的集合)时,求整个句子的语义。
3、已知语义时,求该语义对应的句子。
3.1、给文章拟标题
4、已知问句时,求答句。
5、计算两个句子的语义相似度。
6、推理
6.1、三段论推理
————————————————
版权声明:本文为CSDN博主「gzdmcaoyc」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/gzdmcaoyc/article/details/79894763
一THE END一
免责声明:本文来自互联网新闻客户端自媒体,不代表本网的观点和立场。
合作及投稿邮箱:E-mail:editor@tusaishared.com