SSTable是LevelDB的核心,将数据文件组织存储在磁盘中。有关SSTable的结构设计参考下列博客:
- http://blog.csdn.net/u012658346/article/details/45644195
- https://www.cnblogs.com/cobbliu/p/6194072.html
- http://blog.csdn.net/anderscloud/article/details/7182165
SSTable是LevelDB的核心,将数据文件组织存储在磁盘中。有关SSTable的结构设计参考下列博客:
在LevelDB中,Put和Delete操作本质上都是Writebatch,不同点在于key值有不同的标记。真正的Delete会在Compaction时删除标记为kTypeDeletion的数据。(在本文中mem和memtable等价,imm和Immutable等价)
enum ValueType { kTypeDeletion = 0x0, kTypeValue = 0x1 };Read more
首先下载PostgreSQL源码,我用的是PostgreSQL9.4.2。
/home/username/
新建pg
文件夹,然后在.bashrc
文件内添加#每次更改.bashrc之后,执行 source ~/.bashrc export PG=/home/username/pg
./configure --prefix=$PG --enable-depend --enable-cassert --enable-debug
make install
.bashrc
内添加export PATH=$PATH:/home/username/pg/binRead more
MIT 6.824 Lab1要求使用Go语言实现一个简易版本的MapReduce框架,在实现之前先通过下图了解MapReduce的执行过程
以实验1的wordcount为例,首先将输入文件分成5
份,用户规定Map
操作和Reduce
操作的数量设为m
和r
,Map
和Reduce
操作用用户自己定义,由Master
将5
个文件分配给3
个worker
,每一个执行Map操作的worker将生成r
个中间文件(key,val),Map
操作要保证相同key
值的数据在同一个文件中,然后执行Reduce
操作,每个Reduce
产生一个文件
線性迴歸模型:$h_\theta(x) = \theta * x$
參數$\theta = (\theta_0, \theta_2, ..., \theta_n)$
Cost Function
爲:$J(\theta) = \frac{1}{2} \sum_i \left( h_\theta(x^{(i)}) - y^{(i)} \right)2$
m
爲訓練集的大小,解線性迴歸模型即就是求出最小的Cost Function
對應的$\theta$值