一种总结内容的算法
An algorithm for summarizing content
我正在考虑总结我计划建立的网站上的内容。比起一页又一页的内容,我更愿意为他们提供每个主题的摘要。
关于如何做到这一点,我有一些想法,主要是关于找到最常见的单词和写一个简短的形式。这确实有帮助,即使少一个字符也会有很大的不同。有没有人能给我一些建议或指出正确算法的正确来源?我知道我必须自己开发算法,但我在开始之前做了一些研究。
我认为这是对不同摘要方法的一个很好的概述:http://en.wikipedia.org/wiki/Automatic_summarization
NLTK工具箱也应该是非常有用的起点:http://nltk.org/,它已经被用来构建摘要器,例如https://github.com/amsqr/NaiveSumm
相关文章:
- 为什么一种算法在相同的时间复杂度下比另一种算法更快?
- 是否有一种 STL 算法可以最后找到,但它也适用于指针?
- 我是 c++ 的新手,有没有一种算法可以找到 3d 数组中最接近的 0 的距离?
- 有没有一种算法可以将 LAPACK 排列更改为真正的排列?
- 这是河内算法的递归塔是一种不知情的搜索
- 有没有一种方法可以使用弗洛伊德-沃歇尔算法给出最短路径,其中存在负权重循环而不允许重叠边缘?
- 如何编写一种算法,该算法在哪个行中显示出在哪个行中显示(我使用的是std :: map)
- 了解一种神秘地起作用的递归二进制搜索算法
- 寻找一种单一的定时方法来测试各种算法,不包括它们的输入
- 这两种算法中有效的一种算法
- 是否有一种算法可以查找字符串中任何指定字符的第一次出现
- 一种用于排序和洗牌等值条目的快速算法(最好是STL的)
- 是否有一种更有效的方法来执行此算法
- 需要一种在平面表示中进行数组索引的算法
- 变换-一种变异序列算法
- 有没有一种算法可以使用opencv来分离图像的前景和背景
- 如何设计一种算法,将两个浮点数相乘而不带"*"?
- 是否只有一种方法可以实现气泡排序算法
- 是一种值得在这里实现的排序算法
- C++11通过两种算法中的一种来完成任务