我的个人小站
07
21
中文文本特征抽取 中文文本特征抽取
我们可以在分词的时候添加停用词,就像下面这样 因为中文分词需要自己手动分开,那么我们如何自动分词呢?可以用结巴分词 示例代码: def cut_word(text): """ 进行中文分词:"我爱北京天安门" -->
2020-07-21
21
文本特征提取 文本特征提取
文本中 单词,句子,短语,字母 什么作为特征值比较好 单词 先来第一个API data = ["life is short,i like like python", "life is too long,i dislike python"]
2020-07-21
21
context context
这个主要是用于go多线程上的,如果我们想控制子进程,我们可以通过chan(管道)来实现,但是这个方法只能控制单个进程,如果我们想控制多个进程咋办,我们可以使用contex来控制 func main() { ctx, cancel := c
2020-07-21
21
博客系统还需要大改 博客系统还需要大改
[info]经过这段时间内测,群友们反馈了大量问题,有些问题是涉及到数据库的问题,还有就是有很多建议,考虑到这些问题和建议,所以我会对博客系统继续大改,稳定版本暂时没那么快放出,请大家别急。[/info] 这里继续说几个购买的问题配置要求最
2020-07-21
20
字典特征抽取 字典特征抽取
特征工程介绍影响机器学习的几个地方算法或特征工程 数据和特征决定机器学习的上限,而模型和算法只是逼近这个上限。 特征抽取将任意数据转换为可用于机器学习的数字特征 特征提取API 在计算机中,我们可以用一维数组来存储向量,用二维数组来存储矩
2020-07-20
20
mongo-go-dirver库 mongo-go-dirver库
这个是go语言连接MongoDB的官方驱动,虽然目前市面上有mgo驱动,但是这个驱动不维护了,所以我们不能再用这个驱动,目前只采用官方驱动。 目前找到的几个教程:https://www.cnblogs.com/zcqkk/p/1123422
2020-07-20
20
自动增长 自动增长
MongoDB 没有像 SQL 一样有自动增长的功能, MongoDB 的 _id 是系统自动生成的12字节唯一标识。 但在某些情况下,我们可能需要实现 ObjectId 自动增长功能。 由于 MongoDB 没有实现这个功能,我们可以通过
2020-07-20
20
固定集合 固定集合
MongoDB 固定集合(Capped Collections)是性能出色且有着固定大小的集合,对于大小固定,我们可以想象其就像一个环形队列,当集合空间用完后,再插入的元素就会覆盖最初始的头部的元素! 这个东西用的不多,先不考虑https:
2020-07-20
20
GridFS GridFS
GridFS 用于存储和恢复那些超过16M(BSON文件限制)的文件(如:图片、音频、视频等)。GridFS 也是文件存储的一种方式,但是它是存储在MonoDB的集合中。GridFS 可以更好的存储大于16M的文件。GridFS 会将大文件
2020-07-20
20
正则表达式 正则表达式
正则表达式是使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。许多程序设计语言都支持利用正则表达式进行字符串操作。MongoDB 使用 $regex 操作符来设置匹配字符串的正则表达式。MongoDB使用PCRE (Perl Com
2020-07-20
27 / 72