sqlite中的文本挖掘
text mining in sqlite
我有sqlite数据库,需要在其中找到最常见的单词。例如,
文本
桌子椅子地板
桌子椅子
表
解决方案需要
词数量
表,3
椅子,2
地板 1
数据库很大(几个Gb)。我正在寻找SQL的解决方案。也可能使用c++或其他方法
Sqlite没有任何命令,这将允许从单个字符串生成多行(并且不能轻易拥有;这样的事情需要"unpack"扩展到SQL)。因此,您需要一个应用程序代码来将注释拆分为单词。那么您可以创建一个表,在其中将每个单词插入到单独的行中,然后再插入select word, count(rowid) from words group by word
,或者您可以在应用程序中使用哈希映射直接计数单词。
http://www.sqlite.org/fts3.html
查看Fts4aux -直接访问全文索引部分。
相关文章:
- 文本文件中的单词链表
- 从命令行c++发送文本文件名
- 在C++程序中输入的文本文件将不起作用,除非文本被复制和粘贴
- 2D数组来自文本输入,中间有空格
- 查询SQLite数据库中的日期
- 如何将内容数组写入文本文件?
- 带内存和隔离功能的SQLite
- 无法通过空白将文本文件行分隔为矢量
- 我正在使用嵌套的while循环来解析具有多行的文本文件,但由于某种原因,它只通过第一行,我不知道为什么
- C++将文本文件中的数据读取到结构数组中
- 在指针的帮助下,文本文件中单词的频率
- 将字符指针十六进制转换为字符串并保存在文本文件C++中
- 将值从二维数组输出到文本文件
- 如何在c++中从文本文件中逐行读取整数
- 如何创建一个QTableWidgetItem,用长文本右对齐,左边有省略号
- 从文本文件中读取时钟时间和事件时间并进行处理
- 如何从文本文件中读取值和数组
- 在这种情况下,将数据存储在诸如SQLite之类的数据库中,还是存储在平面文本文件中更好
- sqlite中的文本挖掘
- SQLite文本转换为整数或REAL在c++做太多