Skip to content

Commit 603ecd8

Browse files
Merge pull request #160 from jiangzhonglian/master
更新 8,11和15章的内容
2 parents cbb646f + f7a092d commit 603ecd8

6 files changed

Lines changed: 8 additions & 26 deletions

File tree

bin/15_test.sh

Lines changed: 0 additions & 19 deletions
This file was deleted.

docs/11.使用Apriori算法进行关联分析.md

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -28,13 +28,13 @@
2828
## Apriori 原理
2929

3030
假设我们一共有 4 个商品: 商品0, 商品1, 商品2, 商品3。
31-
所有可能的组合如下:
31+
所有可能的情况如下:
3232
![4种商品的所有组合](../images/11.Apriori/apachecn_apriori_goods_all_1.jpg)
3333
如果我们计算所有组合的支持度,也需要计算 15 次。即 2^N - 1 = 2^4 - 1 = 15。
3434
随着物品的增加,计算的次数呈指数的形式增长 ...
3535
为了降低计算次数和时间,研究人员发现了一种所谓的 Apriori 原理,即某个项集是频繁的,那么它的所有子集也是频繁的。
3636
例如,如果 {0, 1} 是频繁的,那么 {0}, {1} 也是频繁的。
37-
该原理直观上没有什么帮助,但是如果反过来看就有用了,也就是说如果一个项集是 `非频繁项集`那么它的所有超级也是非频繁项集,如下图所示:
37+
该原理直观上没有什么帮助,但是如果反过来看就有用了,也就是说如果一个项集是 `非频繁项集`那么它的所有超集也是非频繁项集,如下图所示:
3838

3939
![非频繁项集](../images/11.Apriori/非频繁项集.png)
4040

docs/15.大数据与MapReduce.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -1,4 +1,4 @@
1-
# 大数据与MapReduce
1+
# 第15章 大数据与MapReduce
22

33
![大数据与MapReduce首页](/images/15.BigData_MapReduce/mr_headPage.jpg "大数据与MapReduce首页")
44

docs/6.支持向量机.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -9,7 +9,7 @@
99
* 支持向量(Support Vector)就是离分隔超平面最近的那些点。
1010
* 机(Machine)就是表示一种算法,而不是表示机器。
1111

12-
## 支持向量机 背景
12+
## 支持向量机 场景
1313

1414
* 如果把所有的点看作地雷,那么我们(超平面)得找到最近所有的地雷,并保证我们离它最远。
1515
* 所以:选择D会比B、C分隔的效果要好很多。

docs/8.预测数值型数据:回归.md

Lines changed: 2 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -11,7 +11,7 @@
1111

1212
回归的目的是预测数值型的目标值。最直接的办法是依据输入写出一个目标值的计算公式。
1313

14-
假如你想要预测姐姐男友汽车的功率大小,可能会这样计算:
14+
假如你想要预测兰博基尼跑车的功率大小,可能会这样计算:
1515

1616
HorsePower = 0.0015 * annualSalary - 0.99 * hoursListeningToPublicRadio
1717

@@ -88,6 +88,7 @@ HorsePower = 0.0015 * annualSalary - 0.99 * hoursListeningToPublicRadio
8888
数据格式为:
8989

9090
```
91+
x
9192
1.000000 0.067732 3.176513
9293
1.000000 0.427810 3.816464
9394
1.000000 0.995731 4.550095

src/python/8.PredictiveNumericalDataRegression/regression.py

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -584,9 +584,9 @@ def regression5():
584584

585585

586586
if __name__ == "__main__":
587-
# regression1()
587+
regression1()
588588
# regression2()
589589
# abaloneTest()
590590
# regression3()
591-
regression4()
591+
# regression4()
592592
# regression5()

0 commit comments

Comments
 (0)