网站有关论文范文集,与Web结构挖掘在电子商务网站结构优化中的应用相关论文格式范文
本论文是一篇网站有关论文格式范文,关于Web结构挖掘在电子商务网站结构优化中的应用相关本科论文范文。免费优秀的关于网站及结构及页面方面论文范文资料,适合网站论文写作的大学硕士及本科毕业论文开题报告范文和学术职称论文参考文献下载。
;到a(u),h(v)收敛.
I操作:(1)
O操作:(2)
每次迭代后需要对a(u),h(v)进行规范化处理:
式(1)反映了若一个网页由很多好的Hub指向,则其权威值会相应增加(即权威值增加为所有指向它的网页的现有Hub值之和).式(2)反映了若一个网页指向许多好的权威页,则Hub值也会相应增加(即Hub值增加为该网页链接的所有网页的权威值之和).HITS算法输出一组具有较大Hub值的网页和具有较大权威值的网页.
HITS算法存在的主要问题:
(1)实际应用中,由S生成T的时间开销很昂贵;
(2)站点内部网页在权威度数值上可相互加强;
(3)网页中一些无关的链接影响A,H值的计算;
(4)存在与查询主题无关的网页即主题漂移现象.
四、应用WEB结构挖掘算法提高网站价值
将WEB结构挖掘算法应用到自身网站的结构优化中来,对提高网站的价值有着重要意义.网站结构优化包括两个方面,物理结构的优化与逻辑结构的优化.Web结构挖掘所有算法都将网页中的链接(逻辑结构)作为主要挖掘的对象,特别在实际应用中,大多数用户都是使用基于PageRank算法的Google、Yahoo和Baidu等搜索引擎.但网站物理结构的合理性也是影响网站价值的一个重要因素.因此采取以下几种策略,将有助于用户将网站定位到相关主题的权威站点,从而获得更高的PR值,以提高电子商务网站在搜索引擎的排名,提高检索结果的质量,提高网站的访问率,提升网站的档次.
1.网站物理结构优化
网站物理结构是指网站真实的目录及文件所存储的位置所决定的结构.网站物理结构优化不但关系到网站的易用性,还会影响到网站在搜索引擎上的排名.合理的网站物理结构可以让Google等搜索引擎轻松搜索到你网站的大多内容,收录你大量的页面,更多的关注你这个网站.虽然合理的链接可以取得一个比较理想的PR值,但由于Web结构挖掘过程是由机器搜索引擎蜘蛛(Spider)自动完成,因此就需要构建一个搜索引擎蜘蛛友好的网站物理结构.
要合理安排网站文件目录结构,使目录结构扁平,有序.网站的目录结构最好不要超过3层,因为每深一级目录,PageRank降低1-2个分值.重要内容放在顶级目录.目录文件夹命名应含关 键 词,网页文件名也应含关 键 词.文件名是词组时应用短横线而不要用下划线隔开.使用英文而不是拼音字母来命名文件及目录.如果目录超过三层,就应使用子域名来调整和简化目录结构层数.
2.网站逻辑结构优化
网站的逻辑结构(链接结构)是由网页间链接所形成的逻辑的或链接的一个网状结构.一般来说网页被一些“重量级”的网站链接的次数越多,PageRank的值就会越高;同样,网页的链接指向越多,PageRank的值也会很高.搜索引擎在决定一个网站的排名时,不仅要对网页内容和结构进行分析,还围绕网站的链接展开分析,并给出相应的PR值.常用链接策略有:
(1)尽可能多地让其他跟本站主题相关或互补的网站链接本站.
(2)同PR值更高的网站进行相互链接.
(3)在流量大、知名度高、频繁更新的重要网站上出现本站链接.
(4)与内容质量高、PR值上升潜力大的网站链接.
(5)与以本站关 键 词在搜索结果中排名前三页的网站进行链接,有了这些网站链接,即使不向搜索引擎提交网站,搜索引擎也自然找到并给予好的排名.
(6)网站提供与主题相关的导出链接,尤其是被链接网站名称(或者栏目名称、文章摘 要和标题等)中含有重要关 键 词时,会丰富自己网站的关 键 词并会被搜索引擎认为有丰富的与主题相关的内容,也有利于排名.
(7)要确保网站内没有死链接,并保持网页内容或链接的稳定性和持久性.
(8)站内页面链接可以为网页创造尽可能多被收录的机会.一个网站被收录的网页数量增加,即使网站首页的PR值不高,也增加了网站总体的搜索引擎可见性.
网站地图是所有页面的快速入口,是搜索引擎更全面索引收录网站的重要因素.它可以方便搜索引擎蜘蛛快速遍历网站所有需要发布的内容.网站地图的三大因素:文本、链接、关 键 词,都极有利于搜索引擎抓取主要页面内容.动态生成目录的网站尤其需要创建网站地图.网站地图的导航能力会使访问者更容易找到所需的东西,且有利于搜索引擎收录更多的页面以及在搜索引擎中得到
网站有关论文范文集
3.页面代码优化
精简代码,减少页面的体积,不但使得网页可以得到更快的下载,而且还影响到搜索引擎对该页面的收录及直接影响网站排名.搜索引擎倾向于在页面文件开始处查找本页的关键性内容,而不是文件的正文.因此要做到代码和页面分离,把javascript文件和css文件分别存放在js和css外部文件中,把重要的页面内容放到页面顶部,以缩小文件体积,提高有效内容占页面体积的百分比,从而提高关 键 词在页面中的比重,以利于搜索引擎快速准确地抓取.另外格式化标签也尽量少用.页面布局应采用DIV+CSS模式并减少表格嵌套,尽量不要使用很难被搜索引擎收录的IFRAME或Frame框架及对搜索引擎蜘蛛不友好的Flush动画等,并保持页面简洁,以利于搜索引擎的收录.
五、结语
目前各大搜索引擎都采用了Web结构挖掘技术中的PageRank算法,为了提升自身网站在各大搜索引擎中的排名,用户应使用Web结构挖掘技术来对自身网站进行评估,发现自身网站结构的不足,并对优化网站结构提供决策依据.通过采取有效措施,提高自身网站结构的合理性,从而提高网站在搜索引擎中的排名,以达到为网站带来更大流量,发掘更多有效用户的目的.随着电子商务迅猛地发展,企业更应该重视并采用这种被挖掘的技术,以提高自身网站的价值.
参考文献:
[1]何晓阳吴强吴治蓉:HITS算法与PageRank算法比较分析,情报杂志2004年第2期
[2]王晓宇周傲:万维网的链接结构分析及其应用综述,软件学报
[3]曹军:Google的PageRank技术剖析,情报杂志2002年第10期
[4]刘丽珍等:网络结构挖掘的关键分析.计算机应用研究,2003(5)116-118
[5]陈定权:Web结构挖掘研究.情报理论与实践,2003(1)59-61
[6]SergeyBrin,LawrencePage,Google的技术剖析,.省略
网站有关论文范文集,与Web结构挖掘在电子商务网站结构优化中的应用相关论文格式范文参考文献资料: