关于句子方面论文范文集,与文档抄袭检测相关论文格式模板
本论文是一篇关于句子方面论文格式模板,关于文档抄袭检测相关毕业论文开题报告范文。免费优秀的关于句子及文本及作业方面论文范文资料,适合句子论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。
了拷贝检测软件COPS原型系统.该系统以标点符号为界,首先将文档按照一个个句子划分,然后统计两篇文档中相同句子的个数,并将它与两篇文档中共有的句子个数的比值作为衡量两篇文档之间相似程度的依据.本文在COPS原型系统的算法基础上提出了一种改进算法.算法的设计如下:以文档句子为基本单位,首先将影响检测结果的句子去除,然后将两个句子的最长公共子串长度作为权值从而确定两个句子间的相似度,最后通过计算文档间句子的相似度来确定文档间的相似度.作者经过对大量文档的研究发现,当用标点符号把文档中的所有句子提取出来以后,有一些不代表任何含义的句子,一般来说长度比较小的句子不代表任何含义.因此,可以假定一个阈值n,当句子的长度小于n时,不应对其进行考虑,即不做比较.通过对两个字符串的最长公共子串长度进行计算后,便可通过将计算的结果作为两个字符串的权值.当两个对比字符串之间的权值越大时,则这两个字符串的相似度就越大.需要设定句子权值的阈值,舍弃相似度较低的句子.最后通过计算两篇文章相似句子数量占两篇文章句子少的文章句子数量的比例来判断两篇文章的相似程度.这篇论文来自 http://www.sxsky.net/zhengzhi/050490077.html
参考文献:
[1]程克敏.基于文本结构和内容的中文论文复制检测系统的研究[D].合肥:合肥工业大学,2007.
[2]杨俊丽.中文学术论文抄袭检测系统研究[D].太原:太原理工大学,2008.
[作者简介]张超(1989.5-),男,单位:华中科技大学文华学院,学历:本科.
关于句子方面论文范文集,与文档抄袭检测相关论文格式模板参考文献资料: