3.2.1 文本特征向量空间表示

    向量空间模型(vector space model,VSM)是目前最常用的一种文本表示模型。在该模型中,它把对文本内容的处理简化为向量空间中的向量运算,并且以空间上的相似度表达语义的相似度。向量空间模型基于这样一个关键假设,即文章中词条出......查看详细>>

标签:CADAL数字图书馆知识

3.2.2 潜在语义分析

    在向量空间模型中,其基本假设(正交假设)词与词之间关系相互独立的这一条件,在实际环境中很难满足。在实际环境中,文本中出现的词往往存在一定的相关性,这在某种程度上会影响向量空间模型计算的结果。同时,这种基于关键字词......查看详细>>

标签:CADAL数字图书馆知识

3.2.3 文本相似度模型

    由上述分析可知,潜在语义分析(latent semantic analysis,LSA)有许多优点,对传统的向量空间模型是一种改进,并且它不需要借助人工构建词典、语法、句法分析等,以体现词条间的相关性。然而,LSA的降维过程,是舍弃不重要的特征向量来达到......查看详细>>

标签:CADAL数字图书馆知识

3.3.1 知识元的内容对象基本准则

    知识元是不可再分割的具有完备知识表达的知识单位,包括概念知识元、事实知识元、数值型知识元等,具体指文献资源中作为知识输入、知识创新及知识输出的单元,包括理论、原理、概念、定义、范例、规则、结论等,表现为一种基......查看详细>>

标签:CADAL数字图书馆知识

3.3.2 CKI知识元的语义模型

    知识元由以下3个层次组成:检索层次,包括学科专业名称、分类号、知识元名称、知识级别、知识元关键词等检索点;知识元描述层次,对知识元的内容进行完整的文字描述及声像辅助描述;关联层次,与该知识元相关联的内容链接条目清......查看详细>>

标签:CADAL数字图书馆知识

3.4.1 知识元的内容构成

    CADAL数字图书馆知识标引(CKI)中的知识元内容包括以下几个方面①:(1)所属学科类别、关键词、分类号。主要用途:一是用来表示该知识元在学科模块层次中的位置,可用于学科知识导航;二是用于实现与关联内容自动链接的链接点,构建......查看详细>>

标签:CADAL数字图书馆知识

3.4.2 知识元抽取

    知识元可分为以下几种类型②:①概念类知识元,是对事物性质、事物变化规律的认识,如“潜在语义分析”是一个概念。②原理类知识元,是对事物性质、事物变化规律的认识,如“勾股定理”是一个原理。③方法类知识元,是指分析、......查看详细>>

标签:CADAL数字图书馆知识

4.1.1 中国古代分类体系

    中国悠久的文化孕育了精深的学术成果,形成了具有自身特色的古代传统学术分科和学术分科体系。对照西方近代的分科观念和学科分类,可以清晰地发现,古代中国完全不同于近代西方意义上的学科分类,中国古代已经建立起一套具有......查看详细>>

标签:CADAL数字图书馆知识

4.1.2 西方分类体系

    西方古代著名的思想家柏拉图将知识系统分为理性、理智、信念和表象4个部分,他将理性和理智定义为本质的、规律性的认识,将信念和表象定义为派生的、易逝的知识。柏拉图的弟子亚里士多德改进了柏拉图的知识分类法,并将知识......查看详细>>

标签:CADAL数字图书馆知识

4.1.3 中国古代分类体系与西方分类体系的比较

    不管是中国古代学科分类标准,还是西方学科分类标准,从两者的学科分类平行视角上看,西方的学术分科及学科分类明显不同于中国古代传统的学科分类。(1)知识体系分类的标准不同。中国古代的知识体系分类主要以研究者和地域为......查看详细>>

标签:CADAL数字图书馆知识
科普知识