花了半天做了个自动生成TAG的小软件

时间: 2011-02-19 / 分类: delphi / 浏览次数: 2,451 views / 0个评论 发表评论

前两天申请了新空间,装上了WP,今天就开始换了新皮肤,挂上GG了

然后开始采集文章,想起以前让人蛋疼的autotag插件就觉得不爽

好像是直接利用YAHOO的相关搜索关键词,其实很多tag都风马牛不相及

我还是喜欢DEDE那种在文章内部直接提取关键词的

当然我没那么有空去弄什么词库,然后对比什么词库里的词的出现频率

我想直接就读取文章,然后去掉所有垃圾代码,只剩下单词,单词中间用空格隔着

然后进一步去掉一些短的词,把剩下的词按出现频率排序,取前面几个词就可以了

有了思路就好办了,花了半天时间去弄,但是中间有一些具体的函数啥的,我都不太懂,只好GOOGLE了

不过最终都解决了

完工后去采集了一些文章,伪原创后提取TAG,效果还可以,就是有一些词太常见,以后等TAG多了再把太常见的词弄一个词库,然后在TAG里去掉就可以了

这个功能以后再增添了

前几天刚开到配置文件ini文件的文章,今天用上了这些东东

想想确实方便很多,以后即使数据库结构修改了,直接在配置文件里改一改就可以了,免得又要编译一次

发表评论

你必须 登录后 才能留言!