博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
lemur run PLSA
阅读量:6581 次
发布时间:2019-06-24

本文共 612 字,大约阅读时间需要 2 分钟。

1.建索引

trec文档的最后一个</DOC>标记后一定要有换行。

建索引可以选用buildindex.exe,或者indribuildindex.exe。然后要说明的是,索引参数文件里有索引类型一项。<indexType> key(或indri)</indexType>。当用buildindex.exe时,建成的两种类型的索引文件是不一样的,甚至以后的概率表结果也有影响(但我不确定);而用indribuildindex.exe时,两种类型好像没啥区别。

2.训练三个概率表(train probability tables p_z.bin, p_z_d.bin, p_w_z.bin)

plsa的参数文件中,索引路径<index></index>,如果索引是indri类型的,则路径就是索引路径;如果是key类型的,则路径末尾要加上.key。

<doTrain></doTrain>是true。运行后的结果是产生三个二进制文件,分别是 p_z.bin, p_z_d.bin, p_w_z.bin。这三个文件的存储路径是相对路径,具体如何确定,我还不确定。

3.显示概率

只要把plsa参数文件中的<doTrain></doTrain>设为false,运行后即显示概率结果。

转载于:https://www.cnblogs.com/kevinGaoblog/archive/2012/06/08/2541761.html

你可能感兴趣的文章
自定义指令的参数
查看>>
python实现进度条
查看>>
Android 一个应用启动另一个应用的说明
查看>>
阿里云CentOS7服务器利用LVM分区挂载磁盘全记录
查看>>
Setting up the Web Admin Tool in LDAP 6.x to communicate via SSL
查看>>
SQL好习惯:编写支持可搜索的SQL
查看>>
Shadowbox
查看>>
【 程 序 员 】:伤不起的三十岁,你还有多远 ?
查看>>
openldap安装
查看>>
[leetcode]count and say
查看>>
润乾报表 - 缓存问题
查看>>
利用IFormattable接口自动参数化Sql语句
查看>>
泛型Dictionary的用法详解
查看>>
明晰三种常见存储技术:DAS、SAN和NAS
查看>>
ContentProvider简单介绍
查看>>
Visual Studio 2014 CTPs 下载 和C# 6.0 语言预览版介绍
查看>>
js混淆 反混淆 在线
查看>>
WinForm 之 程序启动不显示主窗体
查看>>
【转】Oracle索引的类型
查看>>
FragmentTransaction.replace() 你不知道的坑
查看>>