NLP 文本分类问题 发表于 2018-04-23 特征工程在机器学习任务中,特征工程是最繁琐最耗时的。有人认为特征决定了结果的上限,而模型则是去逼近这个上限。文本分类任务中,特征工程通常包括文本预处理、文本表达、特征提取。 阅读全文 »
The Case for Learned Index Structures 学习笔记 发表于 2018-04-23 arxiv 原文地址 摘要数据库索引也可以看做模型:B树把键映射到有序数组的某个位置,散列把键映射到无序数组的某个位置,Bitmap 把键映射到布尔值。那么这些索引技术能不用机器学习模型来做呢?本篇论文给出了一些启发性的尝试。 阅读全文 »