第二个灵魂 发表于 2015-2-3 23:44:40

PHP网站制作之Php完成主动获得关头词的剖析

会MYSQL吗?会,我会把我的信息在数据库里插入删除啦如今的CMS都自带了收集功效,内容和题目绝对来讲很优点理,但大局部情形关头词很难能提取到。因而主动获得关头字成为以后PHP类CMS的“传统成绩”。那若何才干主动获得关头词呢,其次要步调次要可以分为以下三个步调:   1,经由过程分词算法将题目和内容分离停止朋分,提掏出关头词和频度在内容的分词阶段,以后次要的两个算法是中科院的ICTCLAS和隐马尔可夫模子。但这两个都太高端,有必定的门坎,且都是只撑持C++/JAVA。基于PHP确当前有两个是值得保举的PSCWS和HTTPCWS。 SCWS于2008-03-08宣布1.0.0 正式版,到如今最新版本已到了1.0.4。PSCWS是它的PHP版。而HTTPCWS是张宴开辟的,之前叫PHPCWS。PHPCWS 先利用“ICTCLAS 3.0 同享版中文分词算法”的API停止初度分词处置,再利用自行编写的“逆向最大婚配算法”对分词和停止词语兼并处置,并增添标点符号过滤功效,得出分词了局。今朝仅撑持Linux/Unix体系。
2,将提取了局与现有词库停止对照,失掉最合适划定规矩的关头词这里次要就是要看词库了,咱们可以本人界说词库,也能够利用现有的成熟词库。
3,然后将这两套关头词停止对照,失掉最合适以后内容的关头词在这个阶段就是详细情形详细剖析了。以后PHP类CMS都自有本人的提取关头词体系。个中在收集下流传最广的是DEDECMS的分词源码,我也在我的POPCMS上作过测试,后果很不错,不外相似“咱们”等有意义的词提取并被列为关头词的频率太高,乃至有时分还会把空格的HTML提出来做为关头词,亟待改善。不外假如作为帮助功效,它已很好了。别的PHPCMS和DISCUZ的主动提取关头词功效也很壮大。
可以在书上很方便地做标记,及时记下自己的心得体会。

小女巫 发表于 2015-2-4 06:27:53

这些中手常用的知识,当你把我说的这些关键字都可以熟练运用的时候,你可以选择自己

深爱那片海 发表于 2015-2-9 17:39:46

在学习的过程中不能怕麻烦,不能有懒惰的思想。学习php首先应该搭建一个lamp环境或者是wamp环境。这是学习php开发的根本。虽然网络上有很多集成的环境,安装很方便,使用起来也很稳定、

爱飞 发表于 2015-2-25 15:23:13

写js我最烦的就是 ie 和 firefox下同样的代码 结果显示的结果千差万别,还是就是最好不要用遨游去调试,因为有时候遨游是禁用js的,有可能代码是争取结果被遨游折腾的认为是代码写错。

金色的骷髅 发表于 2015-2-26 19:06:41

我要在声明一下:我是个菜鸟!!我对php这门优秀的语言也是知之甚少。但是我要在这里说一下php在网站开发中最常用的几个功能:

灵魂腐蚀 发表于 2015-3-1 20:52:44

在学习的过程中不能怕麻烦,不能有懒惰的思想。学习php首先应该搭建一个lamp环境或者是wamp环境。这是学习php开发的根本。虽然网络上有很多集成的环境,安装很方便,使用起来也很稳定、

活着的死人 发表于 2015-3-10 23:31:09

至于模板嘛,各位高人一直以来就是争论不休,我一只小菜鸟就不加入战团啦,咱们新手还是多学点东西的好。

精灵巫婆 发表于 2015-3-17 12:50:42

个人呢觉得,配wamp 最容易漏的一步就是忘了把$PHP$目录下的libmysql.dll拷贝到windows系统目录的system32目录下,还有重启apache。

小魔女 发表于 2015-3-20 12:41:08

我学习了一段时间后,我发现效果并不好(估计是我自身的问题)。因为一个人的精力总是有限的,同时学习这么多,会导致每个的学习时间都得不到保证。

因胸联盟 发表于 2015-3-27 15:10:53

最后祝愿,php会给你带来快乐的同时 你也会给他带来快乐。

柔情似水 发表于 2015-4-6 00:09:44

使用zendstdio 写代码的的时候,把tab 的缩进设置成4个空格是很有必要的

愤怒的大鸟 发表于 2015-4-15 16:45:18

装在C盘下面可以利用windows的ghost功能可以还原回来(顺便当做是重转啦),当然啦我的编译目录要放在别的盘下,不然自己的劳动成果就悲剧啦。

莫相离 发表于 2015-4-16 21:10:43

装在C盘下面可以利用windows的ghost功能可以还原回来(顺便当做是重转啦),当然啦我的编译目录要放在别的盘下,不然自己的劳动成果就悲剧啦。

变相怪杰 发表于 2015-4-21 20:42:19

php里的数组为空的时候是不能拿来遍历的;(这个有点低级啊,不过我刚被这个边界问题墨迹了好长一会)

admin 发表于 2015-4-26 10:21:52

曾经犯过一个很低级的错误,我在文件命名的时候用了一个横线\\\\\\\'-\\\\\\\' 号,结果找了好几个小时的错误,事实是命名的时候 是不能用横线 \\\\\\\'-\\\\\\\' 的,应该用的是下划线\\\\\\\'_\\\\\\\' ;

分手快乐 发表于 2015-4-26 15:21:22

为了以后维护的方便最好是代码上都加上注释,“予人方便,自己方便”。此外开发文档什么的最好都弄齐全。我觉得这是程序员必备的素质。虽然会消耗点很多的时间。但是确实是非常有必要的。

若天明 发表于 2015-5-3 09:03:52

最后祝愿,php会给你带来快乐的同时 你也会给他带来快乐。

谁可相欹 发表于 2015-6-4 14:16:03

有时候汉字的空格也能导致页面出错,所以在写代码的时候,要输入空格最好用引文模式。

仓酷云 发表于 2015-6-25 22:20:45

至于模板嘛,各位高人一直以来就是争论不休,我一只小菜鸟就不加入战团啦,咱们新手还是多学点东西的好。

透明 发表于 2015-6-30 16:05:24

我还是强烈建议自己搭建php环境。因为在搭建的过程中你会遇到一些问题,通过搜索或是看php手册解决问题后,你会更加深刻的理解它们的工作原理,了解到php配置文件中的一些选项设置。
页: [1]
查看完整版本: PHP网站制作之Php完成主动获得关头词的剖析