china-testing.github.io/index.html at master · china-testing/china-testing.github.io · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
<!DOCTYPE html>
<html lang="cn">
<head>
        <meta charset="utf-8" />
        <title>python自动化测试人工智能</title>
        <link rel="stylesheet" href="/theme/css/main.css" />
</head>

<body id="index" class="home">
        <header id="banner" class="body">
                <h1><a href="/">python自动化测试人工智能 </a></h1>
                <nav><ul>
                    <li><a href="/category/ba-zi.html">八字</a></li>
                    <li><a href="/category/ce-shi.html">测试</a></li>
                    <li><a href="/category/ce-shi-kuang-jia.html">测试框架</a></li>
                    <li><a href="/category/common.html">common</a></li>
                    <li><a href="/category/da-shu-ju.html">大数据</a></li>
                    <li><a href="/category/feng-shui.html">风水</a></li>
                    <li><a href="/category/ji-qi-xue-xi.html">机器学习</a></li>
                    <li><a href="/category/jie-meng.html">解梦</a></li>
                    <li><a href="/category/linux.html">linux</a></li>
                    <li><a href="/category/python.html">python</a></li>
                    <li><a href="/category/shu-ji.html">书籍</a></li>
                    <li><a href="/category/shu-ju-fen-xi.html">数据分析</a></li>
                    <li><a href="/category/zhong-cao-yao.html">中草药</a></li>
                    <li><a href="/category/zhong-yi.html">中医</a></li>
                </ul></nav>
        </header><!-- /#banner -->

            <aside id="featured" class="body">
                <article>
                    <h1 class="entry-title"><a href="/spark_books.html">spark大数据分析中文英文工具书籍下载-持续更新</a></h1>
<footer class="post-info">
        <abbr class="published" title="2019-05-21T07:20:00+08:00">
                Published: 二 21 五月 2019
        </abbr>

        <address class="vcard author">
                By                         <a class="url fn" href="/author/andrew.html">andrew</a>
        </address>
<p>In <a href="/category/python.html">python</a>.</p>

</footer><!-- /.post-info --><ul>
<li><a href="https://china-testing.github.io/practices.html">python测试开发项目实战-目录</a></li>
<li><a href="https://china-testing.github.io/python_books.html">python工具书籍下载-持续更新</a></li>
</ul>
<h2 id="advanced-analytics-with-spark-patterns-for-learning-from-data-at-scale-2nd-2017pdf-spark2-2018pdf"><a href="https://itbooks.pipipan.com/fs/18113597-375150755">Advanced Analytics with Spark - Patterns for Learning from Data at Scale, 2nd 2017.pdf</a> Spark高级数据分析（第2版）- 2018.pdf</h2>
<p><img alt="图片.png" src="https://upload-images.jianshu.io/upload_images/12713060-647583f3a5eab333.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240"></p>
<p>本书是使用Spark进行大规模数据分析的实战宝典，由知名数据科学家撰写。本书在第1版的基础上，针对Spark近年来的发展，对样例代码和所使用的资料进行了大量更新。新版Spark使用了全新的核心API，MLlib和Spark SQL两个子项目也发生了较大变化，本书为关注Spark发展趋势的读者提供了与时俱进的资料，例如Dataset和DataFrame的使用，以及与DataFrame API高度集成的Spark ML API。</p>
<p>作为计算框架，Spark速度快，开发简单，能同时兼顾批处理和实时数据分析，因此很快被广大企业级用户所采纳，并随着近年人工智能的崛起而成为分析和挖掘大数据的重要得力工具。</p>
<p>本书由业内知名数据科学家执笔，通过丰富的示例展示了如何结合Spark、统计方法和真实世界数据集来解决数据分析问题，既涉及模型的构建和评价，也涵盖数据清洗、数据预处理和数据探索，并描述了如何将结果变为生产应用，是运用Apache Spark进行大数据分析和处理的实战宝典。</p>
<p>第2版根据新版Spark杰出实践，对样例代码和所用资料做了大量更新。</p>
<p>本书涵盖模式如下：</p>
<p>● 音乐推荐和Audioscrobbler数据集
● 用决策树算法预测森林植被
● 基于K均值聚类进行网络流量异常检测
● 基于潜在语义算法分析维基百科
● 用GraphX分析伴生网络
● 对纽约出租车轨迹进行空间和时间数据分析
● 通过蒙特卡罗模拟来评估金融风险
● 基因数据分析和BDG项目
● 用PySpark和Thunder分析神经图像数据</p>
<h3 id="_1">参考资料</h3>
<ul>
<li>下载：英文版   <a href="https://itbooks.pipipan.com/fs/18113597-375150755">Advanced Analytics with Spark - Patterns for Learning from Data at Scale, 2nd 2017.pdf</a></li>
<li>下载中文版本 qq群630011153 144081101</li>
<li><a href="https://china-testing.github.io/practices.html">python测试开发项目实战-目录</a></li>
<li><a href="https://github.com/china-testing/python-api-tesing">本文涉及的python测试开发库</a> 谢谢点赞！</li>
<li><a href="https://github.com/china-testing/python-api-tesing/blob/master/books.md">本文相关海量书籍下载</a>   </li>
<li><a href="https://www.jianshu.com/p/49202312f855">2018最佳人工智能机器学习工具书及下载(持续更新)</a></li>
<li>Format Pdf</li>
<li>Page Count  275 Pages</li>
<li><a href="https://github.com/sryza/aas">https://github.com/sryza/aas</a> 1200+ 星</li>
</ul>
<h3 id="_2">作者简介</h3>
<p>作者:[美]桑迪·里扎（Sandy Ryza）， [美]于里·莱瑟森（Uri Laserson）， [英]肖恩·欧文（Sean Owen）， [美]乔希·威尔斯（Josh Wills） 译者:龚少成 邱鑫
【作者简介】
桑迪·里扎（Sandy Ryza），Spark项目代码提交者、Hadoop项目管理委员会委员，Time Series for Spark项目创始人。曾任Cloudera公司高级数据科学家，现就职于Remix公司从事公共交通算法开发。
于里·莱瑟森（Uri Laserson），MIT博士毕业，致力于用技术解决遗传学问题，曾利用Hadoop生态系统开发了可扩展的基因组学和免疫学技术。目前是西奈山伊坎医学院遗传学助理教授，曾任Cloudera公司核心数据科学家。</p>
<p>肖恩·欧文（Sean Owen），Spark、Mahout项目代码提交者，Spark项目管理委员会委员。现任Cloudera公司数据科学总监。</p>
<p>乔希·威尔斯（Josh Wills），Crunch项目发起人，现任Slack公司数据工程主管。曾任Cloudera公司高级数据科学总监。</p>
<h3 id="_3">目录</h3>
<ul>
<li>下载：中文版   <a href="https://itbooks.pipipan.com/fs/18113597-375150760">Advanced Analytics with Spark - Patterns for Learning from Data at Scale, 2nd 2017.pdf</a></li>
</ul>
<div class="highlight"><pre><span></span><span class="err">推荐序</span> <span class="n">ix</span>
<span class="err">译者序</span>　<span class="n">xi</span>
<span class="err">序</span>　<span class="n">xiii</span>
<span class="err">前言</span>　<span class="n">xv</span>
<span class="err">第</span>　<span class="mi">1</span><span class="err">章</span> <span class="err">大数据分析</span>　<span class="mi">1</span>
<span class="mf">1.1</span>　<span class="err">数据科学面临的挑战</span>　<span class="mi">2</span>
<span class="mf">1.2</span>　<span class="err">认识</span><span class="n">Apache</span> <span class="n">Spark</span>　<span class="mi">4</span>
<span class="mf">1.3</span>　<span class="err">关于本书</span>　<span class="mi">5</span>
<span class="mf">1.4</span>　<span class="err">第</span> <span class="mi">2</span><span class="err">版说明</span>　<span class="mi">6</span>
<span class="err">第</span>　<span class="mi">2</span><span class="err">章</span> <span class="err">用</span><span class="n">Scala</span> <span class="err">和</span><span class="n">Spark</span> <span class="err">进行数据分析</span>　<span class="mi">8</span>
<span class="mf">2.1</span>　<span class="err">数据科学家的</span><span class="n">Scala</span>　<span class="mi">9</span>
<span class="mf">2.2</span>　<span class="n">Spark编程模型</span>　<span class="mi">10</span>
<span class="mf">2.3</span>　<span class="err">记录关联问题</span>　<span class="mi">10</span>
<span class="mf">2.4</span>　<span class="err">小试牛刀：</span><span class="n">Spark</span> <span class="n">shell和SparkContext</span>　<span class="mi">11</span>
<span class="mf">2.5</span>　<span class="err">把数据从集群上获取到客户端</span>　<span class="mi">16</span>
<span class="mf">2.6</span>　<span class="err">把代码从客户端发送到集群</span>　<span class="mi">19</span>
<span class="mf">2.7</span>　<span class="err">从</span><span class="n">RDD到DataFrame</span>　<span class="mi">20</span>
<span class="mf">2.8</span>　<span class="err">用</span><span class="n">DataFrame</span> <span class="n">API来分析数据</span>　<span class="mi">23</span>
<span class="mf">2.9</span>　<span class="n">DataFrame的统计信息</span>　<span class="mi">27</span>
<span class="mf">2.10</span>　<span class="n">DataFrame的转置和重塑</span>　<span class="mi">29</span>
<span class="mf">2.11</span>　<span class="n">DataFrame的连接和特征选择</span>　<span class="mi">32</span>
<span class="mf">2.12</span>　<span class="err">为生产环境准备模型</span>　<span class="mi">33</span>
<span class="mf">2.13</span>　<span class="err">评估模型</span>　<span class="mi">35</span>
<span class="mf">2.14</span>　<span class="err">小结</span>　<span class="mi">36</span>
<span class="err">第</span><span class="mi">3</span><span class="err">章</span>　<span class="err">音乐推荐和</span><span class="n">Audioscrobbler数据集</span>　<span class="mi">37</span>
<span class="mf">3.1</span>　<span class="err">数据集</span>　<span class="mi">38</span>
<span class="mf">3.2</span>　<span class="err">交替最小二乘推荐算法</span>　<span class="mi">39</span>
<span class="mf">3.3</span>　<span class="err">准备数据</span>　<span class="mi">41</span>
<span class="mf">3.4</span>　<span class="err">构建第</span> <span class="err">一个模型</span>　<span class="mi">44</span>
<span class="mf">3.5</span>　<span class="err">逐个检查推荐结果</span>　<span class="mi">47</span>
<span class="mf">3.6</span>　<span class="err">评价推荐质量</span>　<span class="mi">50</span>
<span class="mf">3.7</span>　<span class="err">计算</span><span class="n">AUC</span>　<span class="mi">51</span>
<span class="mf">3.8</span>　<span class="err">选择超参数</span>　<span class="mi">53</span>
<span class="mf">3.9</span>　<span class="err">产生推荐</span>　<span class="mi">55</span>
<span class="mf">3.10</span>　<span class="err">小结</span>　<span class="mi">56</span>
<span class="err">第</span><span class="mi">4</span><span class="err">章</span>　<span class="err">用决策树算法预测森林植被</span>　<span class="mi">58</span>
<span class="mf">4.1</span>　<span class="err">回归简介</span>　<span class="mi">59</span>
<span class="mf">4.2</span>　<span class="err">向量和特征</span>　<span class="mi">59</span>
<span class="mf">4.3</span>　<span class="err">样本训练</span>　<span class="mi">60</span>
<span class="mf">4.4</span>　<span class="err">决策树和决策森林</span>　<span class="mi">61</span>
<span class="mf">4.5</span>　<span class="n">Covtype数据集</span>　<span class="mi">63</span>
<span class="mf">4.6</span>　<span class="err">准备数据</span>　<span class="mi">64</span>
<span class="mf">4.7</span>　<span class="err">第</span> <span class="err">一棵决策树</span>　<span class="mi">66</span>
<span class="mf">4.8</span>　<span class="err">决策树的超参数</span>　<span class="mi">72</span>
<span class="mf">4.9</span>　<span class="err">决策树调优</span>　<span class="mi">73</span>
<span class="mf">4.10</span>　<span class="err">重谈类别型特征</span>　<span class="mi">77</span>
<span class="mf">4.11</span>　<span class="err">随机决策森林</span>　<span class="mi">79</span>
<span class="mf">4.12</span>　<span class="err">进行预测</span>　<span class="mi">81</span>
<span class="mf">4.13</span>　<span class="err">小结</span>　<span class="mi">82</span>
<span class="err">第</span><span class="mi">5</span><span class="err">章</span>　<span class="err">基于</span><span class="n">K均值聚类的网络流量异常检测</span>　<span class="mi">84</span>
<span class="mf">5.1</span>　<span class="err">异常检测</span>　<span class="mi">85</span>
<span class="mf">5.2</span>　<span class="n">K均值聚类</span>　<span class="mi">85</span>
<span class="mf">5.3</span>　<span class="err">网络入侵</span>　<span class="mi">86</span>
<span class="mf">5.4</span>　<span class="n">KDD</span> <span class="n">Cup</span> <span class="mi">1999</span><span class="err">数据集</span>　<span class="mi">86</span>
<span class="mf">5.5</span>　<span class="err">初步尝试聚类</span>　<span class="mi">87</span>
<span class="mf">5.6</span>　<span class="n">k的选择</span>　<span class="mi">90</span>
<span class="mf">5.7</span>　<span class="err">基于</span><span class="n">SparkR</span> <span class="err">的可视化</span>　<span class="mi">92</span>
<span class="mf">5.8</span>　<span class="err">特征的规范化</span>　<span class="mi">96</span>
<span class="mf">5.9</span>　<span class="err">类别型变量</span>　<span class="mi">98</span>
<span class="mf">5.10</span>　<span class="err">利用标号的熵信息</span>　<span class="mi">99</span>
<span class="mf">5.11</span>　<span class="err">聚类实战</span>　<span class="mi">100</span>
<span class="mf">5.12</span>　<span class="err">小结</span>　<span class="mi">102</span>
<span class="err">第</span><span class="mi">6</span><span class="err">章</span>　<span class="err">基于潜在语义分析算法分析维基百科</span>　<span class="mi">104</span>
<span class="mf">6.1</span>　<span class="err">文档－词项矩阵</span>　<span class="mi">105</span>
<span class="mf">6.2</span>　<span class="err">获取数据</span>　<span class="mi">106</span>
<span class="mf">6.3</span>　<span class="err">分析和准备数据</span>　<span class="mi">107</span>
<span class="mf">6.4</span>　<span class="err">词形归并</span>　<span class="mi">109</span>
<span class="mf">6.5</span>　<span class="err">计算</span><span class="n">TF</span><span class="o">-</span><span class="n">IDF</span>　<span class="mi">110</span>
<span class="mf">6.6</span>　<span class="err">奇异值分解</span>　<span class="mi">111</span>
<span class="mf">6.7</span>　<span class="err">找出重要的概念</span>　<span class="mi">113</span>
<span class="mf">6.8</span>　<span class="err">基于低维近似的查询和评分</span>　<span class="mi">117</span>
<span class="mf">6.9</span>　<span class="err">词项－词项相关度</span>　<span class="mi">117</span>
<span class="mf">6.10</span>　<span class="err">文档－文档相关度</span>　<span class="mi">119</span>
<span class="mf">6.11</span>　<span class="err">文档－词项相关度</span>　<span class="mi">121</span>
<span class="mf">6.12</span>　<span class="err">多词项查询</span>　<span class="mi">122</span>
<span class="mf">6.13</span>　<span class="err">小结</span>　<span class="mi">123</span>
<span class="err">第</span><span class="mi">7</span><span class="err">章</span>　<span class="err">用</span><span class="n">GraphX分析伴生网络</span>　<span class="mi">124</span>
<span class="mf">7.1</span>　<span class="err">对</span><span class="n">MEDLINE文献引用索引的网络分析</span>　<span class="mi">125</span>
<span class="mf">7.2</span>　<span class="err">获取数据</span>　<span class="mi">126</span>
<span class="mf">7.3</span>　<span class="err">用</span><span class="n">Scala</span> <span class="n">XML工具解析XML文档</span>　<span class="mi">128</span>
<span class="mf">7.4</span>　<span class="err">分析</span><span class="n">MeSH主要主题及其伴生关系</span>　<span class="mi">130</span>
<span class="mf">7.5</span>　<span class="err">用</span><span class="n">GraphX来建立一个伴生网络</span>　<span class="mi">132</span>
<span class="mf">7.6</span>　<span class="err">理解网络结构</span>　<span class="mi">135</span>
<span class="mf">7.6</span><span class="o">.</span><span class="mi">1</span>　<span class="err">连通组件</span>　<span class="mi">136</span>
<span class="mf">7.6</span><span class="o">.</span><span class="mi">2</span>　<span class="err">度的分布</span>　<span class="mi">138</span>
<span class="mf">7.7</span>　<span class="err">过滤噪声边</span>　<span class="mi">140</span>
<span class="mf">7.7</span><span class="o">.</span><span class="mi">1</span>　<span class="err">处理</span><span class="n">EdgeTriplet</span>　<span class="mi">141</span>
<span class="mf">7.7</span><span class="o">.</span><span class="mi">2</span>　<span class="err">分析去掉噪声边的子图</span>　<span class="mi">142</span>
<span class="mf">7.8</span>　<span class="err">小世界网络</span>　<span class="mi">144</span>
<span class="mf">7.8</span><span class="o">.</span><span class="mi">1</span>　<span class="err">系和聚类系数</span>　<span class="mi">144</span>
<span class="mf">7.8</span><span class="o">.</span><span class="mi">2</span>　<span class="err">用</span><span class="n">Pregel计算平均路径长度</span>　<span class="mi">145</span>
<span class="mf">7.9</span>　<span class="err">小结</span>　<span class="mi">150</span>
<span class="err">第</span><span class="mi">8</span><span class="err">章</span>　<span class="err">纽约出租车轨迹的空间和时间数据分析</span>　<span class="mi">151</span>
<span class="mf">8.1</span>　<span class="err">数据的获取</span>　<span class="mi">152</span>
<span class="mf">8.2</span>　<span class="err">基于</span><span class="n">Spark的第三方库分析</span>　<span class="mi">153</span>
<span class="mf">8.3</span>　<span class="err">基于</span><span class="n">Esri</span> <span class="n">Geometry</span> <span class="n">API和Spray的地理空间数据处理</span>　<span class="mi">153</span>
<span class="mf">8.3</span><span class="o">.</span><span class="mi">1</span>　<span class="err">认识</span><span class="n">Esri</span> <span class="n">Geometry</span> <span class="n">API</span>　<span class="mi">154</span>
<span class="mf">8.3</span><span class="o">.</span><span class="mi">2</span>　<span class="n">GeoJSON简介</span>　<span class="mi">155</span>
<span class="mf">8.4</span>　<span class="err">纽约市出租车客运数据的预处理</span>　<span class="mi">157</span>
<span class="mf">8.4</span><span class="o">.</span><span class="mi">1</span>　<span class="err">大规模数据中的非法记录处理</span>　<span class="mi">159</span>
<span class="mf">8.4</span><span class="o">.</span><span class="mi">2</span>　<span class="err">地理空间分析</span>　<span class="mi">162</span>
<span class="mf">8.5</span>　<span class="err">基于</span><span class="n">Spark的会话分析</span>　<span class="mi">165</span>
<span class="mf">8.6</span>　<span class="err">小结</span>　<span class="mi">168</span>
<span class="err">第</span><span class="mi">9</span><span class="err">章</span>　<span class="err">基于蒙特卡罗模拟的金融风险评估</span>　<span class="mi">170</span>
<span class="mf">9.1</span>　<span class="err">术语</span>　<span class="mi">171</span>
<span class="mf">9.2</span>　<span class="n">VaR计算方法</span>　<span class="mi">172</span>
<span class="mf">9.2</span><span class="o">.</span><span class="mi">1</span>　<span class="err">方差－协方差法</span>　<span class="mi">172</span>
<span class="mf">9.2</span><span class="o">.</span><span class="mi">2</span>　<span class="err">历史模拟法</span>　<span class="mi">172</span>
<span class="mf">9.2</span><span class="o">.</span><span class="mi">3</span>　<span class="err">蒙特卡罗模拟法</span>　<span class="mi">172</span>
<span class="mf">9.3</span>　<span class="err">我们的模型</span>　<span class="mi">173</span>
<span class="mf">9.4</span>　<span class="err">获取数据</span>　<span class="mi">173</span>
<span class="mf">9.5</span>　<span class="err">数据预处理</span>　<span class="mi">174</span>
<span class="mf">9.6</span>　<span class="err">确定市场因素的权重</span>　<span class="mi">177</span>
<span class="mf">9.7</span>　<span class="err">采样</span>　<span class="mi">179</span>
<span class="mf">9.8</span>　<span class="err">运行试验</span>　<span class="mi">182</span>
<span class="mf">9.9</span>　<span class="err">回报分布的可视化</span>　<span class="mi">185</span>
<span class="mf">9.10</span>　<span class="err">结果的评估</span>　<span class="mi">186</span>
<span class="mf">9.11</span>　<span class="err">小结</span>　<span class="mi">188</span>
<span class="err">第</span>　<span class="mi">10</span><span class="err">章</span> <span class="err">基因数据分析和</span><span class="n">BDG项目</span>　<span class="mi">190</span>
<span class="mf">10.1</span>　<span class="err">分离存储与模型</span>　<span class="mi">191</span>
<span class="mf">10.2</span>　<span class="err">用</span><span class="n">ADAM</span> <span class="n">CLI导入基因学数据</span>　<span class="mi">193</span>
<span class="mf">10.3</span>　<span class="err">从</span><span class="n">ENCODE数据预测转录因子结合位点</span>　<span class="mi">201</span>
<span class="mf">10.4</span>　<span class="err">查询</span><span class="mi">1000</span> <span class="n">Genomes项目中的基因型</span>　<span class="mi">207</span>
<span class="mf">10.5</span>　<span class="err">小结</span>　<span class="mi">210</span>
<span class="err">第</span>　<span class="mi">11</span><span class="err">章</span> <span class="err">基于</span><span class="n">PySpark和Thunder的神经图像数据分析</span>　<span class="mi">211</span>
<span class="mf">11.1</span>　<span class="n">PySpark简介</span>　<span class="mi">212</span>
<span class="mf">11.2</span>　<span class="n">Thunder工具包概况和安装</span>　<span class="mi">215</span>
<span class="mf">11.3</span>　<span class="err">用</span><span class="n">Thunder加载数据</span>　<span class="mi">215</span>
<span class="mf">11.4</span>　<span class="err">用</span><span class="n">Thunder对神经元进行分类</span>　<span class="mi">221</span>
<span class="mf">11.5</span>　<span class="err">小结</span>　<span class="mi">225</span>
<span class="err">作者介绍</span>　<span class="mi">226</span>
<span class="err">封面介绍</span>　<span class="mi">226</span>
</pre></div>


<h2 id="learning-pyspark-2017pdf"><a href="https://itbooks.pipipan.com/fs/18113597-375034478">Learning PySpark - 2017.pdf</a></h2>
<p><img alt="image.png" src="https://upload-images.jianshu.io/upload_images/12713060-2a3a663f34654b99.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240"></p>
<p>在本地构建数据密集型应用程序，并使用Python和Spark 2.0的强大功能进行大规模部署。</p>
<p>Apache Spark是一个高效集群计算的开源框架，具有强大的数据并行和容错接口。本书将向您展示如何利用Python的强大功能并将其用于Spark生态系统。首先，您将深入了解Spark 2.0体系结构以及如何为Spark设置Python环境。</p>
<p>您将熟悉PySpark中可用的模块。您将学习如何使用RDD和DataFrame抽象数据并了解PySpark的流功能。此外，您将全面了解使用ML和MLlib的PySpark的机器学习功能，使用GraphFrames的图形处理以及使用Blaze的多语言持久性。最后，您将学习如何使用spark-submit命令将应用程序部署到云。</p>
<p>在本书的最后，您将对Spark Python API及其如何用于构建数据密集型应用程序有一个深入的了解。</p>
<p>本书采用了非常全面的循序渐进的方法，因此您可以了解Spark生态系统如何与Python一起使用来开发高效，可扩展的解决方案。每一章都是独立的，以非常易于理解的方式编写，重点关注每个概念的方法和原理。</p>
<h3 id="_4">关于本书</h3>
<ul>
<li>了解为何以及如何有效地使用Python处理数据并在Apache Spark 2.0中构建机器学习模型</li>
<li>开发和部署高效，可扩展的实时Spark解决方案</li>
<li>通过本跳转入门指南，将您对Spark的使用理解提升到新的水平</li>
</ul>
<h3 id="_5">参考资料</h3>
<ul>
<li>英文版本下载：<a href="https://itbooks.pipipan.com/fs/18113597-375034478">Learning PySpark - 2017.pdf</a></li>
<li>中文版本下载qq群630011153 144081101</li>
<li><a href="https://china-testing.github.io/practices.html">python测试开发项目实战-目录</a></li>
<li><a href="https://github.com/china-testing/python-api-tesing">本文涉及的python测试开发库</a> 谢谢点赞！</li>
<li><a href="https://github.com/china-testing/python-api-tesing/blob/master/books.md">本文相关海量书籍下载</a>   </li>
<li><a href="https://www.jianshu.com/p/49202312f855">2018最佳人工智能机器学习工具书及下载(持续更新)</a></li>
<li>Format Pdf</li>
<li>Page Count  265 Pages</li>
<li>https://github.com/PacktPublishing/Learning-PySpark 120+ 星</li>
</ul>
<h3 id="_6">你会学到什么</h3>
<ul>
<li>了解Apache Spark和Spark 2.0架构</li>
<li>使用Spark SQL构建Spark DataFrames并与之交互</li>
<li>了解如何分别使用GraphFrames和TensorFrame解决图形和深度学习问题</li>
<li>读取，转换和理解数据并使用它来训练机器学习模型</li>
<li>使用MLlib和ML构建机器学习模型</li>
<li>了解如何使用spark-submit以编程方式提交应用程序</li>
<li>将本地构建的应用程序部署到群集</li>
</ul>
<h3 id="_7">面向读者</h3>
<p><a href="https://itbooks.pipipan.com/fs/18113597-375269270">pyspark实战指南 - 2017.pdf</a></p>
<p>如果您是想要了解Apache Spark 2.0生态系统的Python开发人员，那么本书适合您。对Python的深刻理解有望在本书中发挥最大作用。熟悉Spark会很有用，但不是强制性的</p>
<h2 id="pyspark-recipes-a-problem-solution-approach-with-pyspark2-2018pdf"><a href="https://itbooks.pipipan.com/fs/18113597-375034484">PySpark Recipes A Problem-Solution Approach with PySpark2 - 2018.pdf</a></h2>
<p><img alt="image.png" src="https://upload-images.jianshu.io/upload_images/12713060-fbd686a1609d944c.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240"></p>
<p>快速找到处理大数据时遇到的常见编程问题的解决方案。 内容以流行的问题解决方案格式呈现。 查找要解决的编程问题。 阅读解决方案。 直接在您自己的代码中应用解决方案。 问题解决了！</p>
<p>PySpark Recipes涵盖了Hadoop及其缺点。 介绍了Spark，PySpark和RDD的体系结构。 您将学习如何应用RDD来解决日常的大数据问题。 包含Python和NumPy，使PySpark的新学习者能够轻松理解和采用该模型。</p>
<h3 id="_8">参考资料</h3>
<ul>
<li>下载：<a href="https://itbooks.pipipan.com/fs/18113597-375034484">PySpark Recipes A Problem-Solution Approach with PySpark2 - 2018.pdf</a></li>
<li>qq群630011153 144081101</li>
<li><a href="https://china-testing.github.io/practices.html">python测试开发项目实战-目录</a></li>
<li><a href="https://github.com/china-testing/python-api-tesing">本文涉及的python测试开发库</a> 谢谢点赞！</li>
<li><a href="https://github.com/china-testing/python-api-tesing/blob/master/books.md">本文相关海量书籍下载</a>   </li>
<li><a href="https://www.jianshu.com/p/49202312f855">2018最佳人工智能机器学习工具书及下载(持续更新)</a></li>
<li>Format Pdf</li>
<li>Page Count  265 Pages</li>
<li>https://github.com/Apress/pyspark-recipes 10+ 星</li>
</ul>
<h3 id="_9">你会学到什么</h3>
<ul>
<li>了解PySpark2和SparkSQL的高级功能</li>
<li>优化您的代码</li>
<li>使用Python编写SparkSQL程序</li>
<li>在Python中使用Spark Streaming和Spark MLlib</li>
<li>使用GraphFrames执行图形分析</li>
</ul>
<h3 id="_10">面向读者</h3>
<p>数据分析师，Python程序员，大数据爱好者</p>
<h2 id="machine-learning-with-pyspark-2019pdf"><a href="https://itbooks.pipipan.com/fs/18113597-375034463">Machine Learning with PySpark - 2019.Pdf</a></h2>
<p><img alt="image.png" src="https://upload-images.jianshu.io/upload_images/12713060-5b33e43a88f4d6ec.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240"></p>
<p>使用PySpark构建机器学习模型，自然语言处理应用程序和推荐系统，以解决各种业务挑战。</p>
<p>本书从Spark的基础知识及其演变开始，然后介绍了传统机器学习算法的整个范围，以及使用PySpark的自然语言处理和推荐系统。使用PySpark进行机器学习向您展示如何构建有监督的机器学习模型，如线性回归，逻辑回归，决策树和随机森林。您还将看到无监督的机器学习模型，例如K-means和层次聚类。</p>
<p>本书的主要部分侧重于特征工程，以便使用PySpark创建有用的功能来训练机器学习模型。自然语言处理部分包括文本处理，文本挖掘和嵌入分类。阅读本书后，您将了解如何使用PySpark的机器学习库来构建和培训各种机器学习模型。此外，您可以熟悉相关的PySpark组件，例如数据提取，数据处理和数据分析，您可以使用它们来开发数据驱动的智能应用程序。您将学习如何构建一系列受监督和无监督的机器学习算法使用Spark MLlib库实现机器学习算法使用Spark MLlib库开发推荐系统处理与特征工程，类平衡，偏差和方差以及交叉验证相关的问题以构建最佳拟合模型。</p>
<p>本书适用于数据科学和机器学习专业人员。</p>
<h2 id="pyspark-cookbook-2018pdf"><a href="https://itbooks.pipipan.com/fs/18113597-375034448">PySpark Cookbook - 2018.pdf</a></h2>
<p><img alt="image.png" src="https://upload-images.jianshu.io/upload_images/12713060-717c04b5f39c86d5.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240"></p>
<p>结合Apache Spark和Python的强大功能，构建有效的大数据应用程序</p>
<p>主要特点</p>
<ul>
<li>使用PySpark执行有效的数据处理，机器学习和分析</li>
<li>克服使用Python开发和部署Spark解决方案的挑战</li>
<li>探索有效结合Python和Apache Spark以处理数据的方法</li>
</ul>
<p>图书说明</p>
<p>Apache Spark是一个高效集群计算的开源框架，具有强大的数据并行和容错接口。 PySpark Cookbook提供了有效且省时的方法，可充分利用Python的强大功能并将其用于Spark生态系统。</p>
<p>您将首先学习Apache Spark架构以及如何为Spark设置Python环境。然后，您将熟悉PySpark中可用的模块，并毫不费力地开始使用它们。除此之外，您还将了解如何使用RDD和DataFrame抽象数据，并了解PySpark的流功能。然后，您将继续使用ML和MLlib来解决与PySpark的机器学习功能相关的任何问题，并使用GraphFrames来解决图形处理问题。最后，您将探索如何使用spark-submit命令将应用程序部署到云。</p>
<p>在本书的最后，您将能够使用Apache API的Python API来解决与构建数据密集型应用程序相关的任何问题。</p>
<h3 id="_11">参考资料</h3>
<ul>
<li>下载：<a href="https://itbooks.pipipan.com/fs/18113597-375034448">PySpark Cookbook - 2018.pdf</a></li>
<li>qq群630011153 144081101</li>
<li><a href="https://china-testing.github.io/practices.html">python测试开发项目实战-目录</a></li>
<li><a href="https://github.com/china-testing/python-api-tesing">本文涉及的python测试开发库</a> 谢谢点赞！</li>
<li><a href="https://github.com/china-testing/python-api-tesing/blob/master/books.md">本文相关海量书籍下载</a>   </li>
<li><a href="https://www.jianshu.com/p/49202312f855">2018最佳人工智能机器学习工具书及下载(持续更新)</a></li>
<li>Format Pdf</li>
<li>Page Count  330 Pages</li>
<li>https://github.com/PacktPublishing/PySpark-Cookbook 10+ 星</li>
</ul>
<h3 id="_12">你会学到什么</h3>
<ul>
<li>在虚拟环境中配置PySpark的本地实例</li>
<li>在本地和多节点环境中安装和配置Jupyter</li>
<li>使用pyspark.sql从JSON和字典创建DataFrames</li>
<li>探索ML模块中可用的回归和聚类模型</li>
<li>使用DataFrames转换用于建模的数据</li>
<li>连接到PubNub并在流上执行聚合</li>
</ul>
<h3 id="_13">目录</h3>
<ul>
<li>Spark安装和配置</li>
<li>使用RDD提取数据</li>
<li>使用DataFrames抽象数据</li>
<li>准备建模数据</li>
<li>使用MLLib进行机器学习</li>
<li>使用ML模块进行机器学习</li>
<li>使用PySpark进行结构化流式处理</li>
<li>GraphFrames  - 使用PySpark的图论</li>
</ul>
<h3 id="_14">参考资料</h3>
<ul>
<li>下载： <a href="https://itbooks.pipipan.com/fs/18113597-375034463">Machine Learning with PySpark - 2019.Pdf</a></li>
<li>qq群630011153 144081101</li>
<li><a href="https://china-testing.github.io/practices.html">python测试开发项目实战-目录</a></li>
<li><a href="https://github.com/china-testing/python-api-tesing">本文涉及的python测试开发库</a> 谢谢点赞！</li>
<li><a href="https://github.com/china-testing/python-api-tesing/blob/master/books.md">本文相关海量书籍下载</a>   </li>
<li><a href="https://www.jianshu.com/p/49202312f855">2018最佳人工智能机器学习工具书及下载(持续更新)</a></li>
<li>Format Pdf</li>
<li>Page Count  223 Pages</li>
<li>
<p>https://github.com/Apress/machine-learning-with-pyspark 10+ 星</p>
</li>
<li>
<p>另外一个开源教程 https://github.com/awantik/pyspark-tutorial 100+ 星</p>
</li>
<li>
<p>一个开源教程 https://github.com/zekelabs/machine-learning-using-pyspark  &lt;10 星</p>
</li>
<li>
<p>https://github.com/XD-DENG/Spark-ML-Intro 40左右 星</p>
</li>
</ul>
<h3 id="_15">参考资料</h3>
<ul>
<li>工作日技术支持QQ群 630011153 144081101</li>
<li><a href="https://china-testing.github.io/spark_books.html">本文最新版本地址</a></li>
<li><a href="https://github.com/china-testing/python-api-tesing">本文涉及的python测试开发库</a> 谢谢点赞！</li>
<li><a href="https://github.com/china-testing/python-api-tesing/blob/master/books.md">本文相关海量书籍下载</a></li>
<li>道家技术-手相手诊看相中医等钉钉群21734177 qq群：391441566 184175668 338228106 看八字、风水、手相、面相、舌相、抽签、体质识别。服务费50元每人次起。请联系钉钉或者微信pythontesting</li>
<li><a href="https://china-testing.github.io/testing_training.html">接口自动化性能测试线上培训大纲</a></li>
</ul>                </article>
            </aside><!-- /#featured -->
                <section id="content" class="body">
                    <h1>Other articles</h1>
                    <hr />
                    <ol id="posts-list" class="hfeed">

            <li><article class="hentry">
                <header>
                    <h1><a href="/testing_resource.html" rel="bookmark"
                           title="Permalink to 软件测试精品文章与资源汇总">软件测试精品文章与资源汇总</a></h1>
                </header>

                <div class="entry-content">
<footer class="post-info">
        <abbr class="published" title="2019-05-16T06:30:00+08:00">
                Published: 四 16 五月 2019
        </abbr>

        <address class="vcard author">
                By                         <a class="url fn" href="/author/andrew.html">andrew</a>
        </address>
<p>In <a href="/category/ce-shi.html">测试</a>.</p>

</footer><!-- /.post-info -->                <ul>
<li><a href="https://china-testing.github.io/practices.html">python测试开发项目实战-目录</a></li>
<li><a href="https://china-testing.github.io/python_books.html">python工具书籍下载-持续更新</a></li>
</ul>
<h3 id="_1">说明</h3>
<p>本文持续更新，首发地址 https://china-testing.github.io/testing_resource.html
备份地址 https://www.jianshu.com/p/faffa3983bbd</p>
<p>版本 1.0 2019-05-16  https://china-testing.github.io</p>
<h3 id="_2">测试基础</h3>
<ul>
<li><a href="https://github.com/china-testing/python-api-tesing">python测试开发库及项目</a></li>
<li><a href="https://china-testing.github.io/testing_basic_how_google.html">谷歌如何测试软件</a></li>
<li><a href="https://china-testing.github.io/python_books.html" title="Permalink to python工具书籍下载-持续更新">python工具书籍下载-持续更新</a></li>
<li><a href="https://china-testing.github.io/testing_standard.html" title="Permalink to 2018软件测试标准汇总下载">2018软件测试标准汇总下载</a></li>
<li><a href="https://china-testing.github.io/python_weeks.html" title="Permalink to python测试开发自学每周一练">python测试开发自学每周一练</a></li>
<li><a href="https://www.jianshu.com/p/92c7bd0189d4">python测试工具开发自学每周一练-2018-06</a></li>
<li><a href="https://china-testing.github.io/testing_books.html">软件测试工具书籍与面试题汇总下载(持续更新)</a></li>
<li><a href="https://www.jianshu.com/p/1872da4c9976">python测试开发自动化测试数据分析人工智能自学每周一练-2018-07</a></li>
<li><a href="https://www.jianshu.com/p/d586a8ac3c7c">为什么选择软件测试作为职业？</a></li>
<li><a href="https://www.jianshu.com/p/6066789b7534">软件测试快速入门1简介，基础知识和重要性</a></li>
<li><a href="https://www.jianshu.com/p/c7ae894972bc">软件测试快速入门2软件测试职业生涯</a></li>
<li><a href="https://www.jianshu.com/p/59dd7ea33b98">软件测试快速入门3原则</a></li>
</ul>
<h3 id="_3">实战</h3>
<ul>
<li><a href="https://www.jianshu.com/p/99aeb2de6109">在项目中学习软件测试1网银测试</a></li>
<li><a href="https://www.jianshu.com/p/c94125700e22">在项目中学习软件测试2安全测试</a></li>
</ul>
<h3 id="_4">性能测试</h3>
<ul>
<li><a href="https://china-testing.github.io/testing_tools_perf.html">软件测试专家工具包2性能测试</a></li>
<li><a href="https://www.jianshu.com/p/10896d189376">python3测试工具开发快速入门教程12性能测试简介</a></li>
<li><a href="https://china-testing.github.io/python3_lib_boom.html" title="Permalink to python标准模块介绍-性能测试工具boom">python标准模块介绍-性能测试工具boom</a></li>
<li><a href="https://www.jianshu.com/p/1a8007d05982">性能测试工具locustio</a></li>
<li><a href="https://www.jianshu.com/p/52f32a312b9a">2018最佳12个开源或免费web服务器和客户端性能测试工具 …</a></li></ul>
                <a class="readmore" href="/testing_resource.html">read more</a>
                </div><!-- /.entry-content -->
            </article></li>

            <li><article class="hentry">
                <header>
                    <h1><a href="/wannianli_books.html" rel="bookmark"
                           title="Permalink to 万年历书籍汇总下载">万年历书籍汇总下载</a></h1>
                </header>

                <div class="entry-content">
<footer class="post-info">
        <abbr class="published" title="2019-05-09T07:20:00+08:00">
                Published: 四 09 五月 2019
        </abbr>

        <address class="vcard author">
                By                         <a class="url fn" href="/author/andrew.html">andrew</a>
        </address>
<p>In <a href="/category/shu-ji.html">书籍</a>.</p>

</footer><!-- /.post-info -->                <ul>
<li><a href="https://china-testing.github.io/practices.html">python测试开发项目实战-目录</a></li>
<li><a href="https://china-testing.github.io/python_books.html">python工具书籍下载-持续更新</a></li>
</ul>
<h3 id="-2013pdf"><a href="https://itbooks.pipipan.com/fs/18113597-373452308">万年历- 2013.pdf</a></h3>
<p><img alt="image.png" src="https://upload-images.jianshu.io/upload_images/14634966-30805ee3829dc336.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240"></p>
<p>前言
第一章　历法常识
第二章　纪年法及相关常识
第三章　民间择吉
第四章　民间谚语精粹
第五章　家庭医疗常识</p>
<p>下载 QQ群 338228106</p>
<h3 id="_1">参考资料</h3>
<ul>
<li>讨论钉钉群21734177, qq群391441566 184175668 338228106</li>
<li><a href="https://china-testing.github.io/testing_books.html">本文最新版本地址</a></li>
<li><a href="https://github.com/china-testing/python-api-tesing">本文涉及的python测试开发库</a> 谢谢点赞！</li>
<li><a href="https://github.com/china-testing/python-api-tesing/blob/master/society_books.md">本文相关海量书籍下载</a> </li>
</ul>
<h3 id="-2012pdf"><a href="https://itbooks.pipipan.com/fs/18113597-373454963">中华万年历全书(超值版) (家庭珍藏经典畅销书系)-2012.pdf</a></h3>
<p><img alt="image.png" src="https://upload-images.jianshu.io/upload_images/14634966-45ee967dea55ee0e.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240"></p>
<p>雅瑟主编的《中华万年历全书(超值金版)》突破了以往同类书籍过于“民俗”的特点，摒除了旧有的传统思想和不符合时代的现点，以科学性和实用性为根本，突出知识性和趣味性；语言通俗易懂，数据精确科学，版式设计精美，是集查阅、欣赏和实用为一体的生活工具书。
《中华万年历全书(超值金版)》主要由三大部分和附录构成 …</p>
                <a class="readmore" href="/wannianli_books.html">read more</a>
                </div><!-- /.entry-content -->
            </article></li>

            <li><article class="hentry">
                <header>
                    <h1><a href="/fengshui_yijing4.html" rel="bookmark"
                           title="Permalink to 风水趋吉避凶法">风水趋吉避凶法</a></h1>
                </header>

                <div class="entry-content">
<footer class="post-info">
        <abbr class="published" title="2019-04-30T08:40:00+08:00">
                Published: 二 30 四月 2019
        </abbr>

        <address class="vcard author">
                By                         <a class="url fn" href="/author/andrew.html">andrew</a>
        </address>
<p>In <a href="/category/feng-shui.html">风水</a>.</p>

</footer><!-- /.post-info -->                <ul>
<li><a href="https://china-testing.github.io/practices.html">python测试开发项目实战-目录</a></li>
<li><a href="https://china-testing.github.io/python_books.html">python工具书籍下载-持续更新</a></li>
</ul>
<h2 id="_1">确定财位</h2>
<p>确定财位一般来说,人们的财运是处于一个被动的状态下,有些人一生都在等待好运到来,从而求得财富。按照风水学的理论,人们可以通过对风水的利用,变被动为主动,利用风水招财。这样一来,就要首先确定好何为“财位”。</p>
<h3 id="_2">财位布局</h3>
<p>财位,顾名思义,就是指生财旺位,是整个房屋当中财气最为旺盛的地方。但是财位又是因地而异的,不同的房屋,财位又不尽相同。那么,在变幻莫测的财位当中,人们应该如何把握财位,为自己提升财运呢?</p>
<p>想获得大量的财富,就必须从整体上选一个风水极佳的住处,大凡生财旺位的房屋,无一例外都拥有良好的整体环境,房屋方正规则、门窗开在财位、没有行煞等优势。从总体上来讲,房屋前有水环绕是生财旺宅,但要考虑水流的方向,如果水流方向与房屋的坐向相一致,不利招财,钱财会顺着河流从家中流走,从而形成家财外流;相反,水流方向与房屋坐向相对,财源才能滚滚流入家中。除整体环境之外,内部也得合理布局,方可称之为“财富旺宅”。</p>
<ul>
<li>大门</li>
</ul>
<p>大门是财气的通道,只有在门口聚集财气 …</p>
                <a class="readmore" href="/fengshui_yijing4.html">read more</a>
                </div><!-- /.entry-content -->
            </article></li>

            <li><article class="hentry">
                <header>
                    <h1><a href="/fengshui_yijing2.html" rel="bookmark"
                           title="Permalink to 2吉宅风水必知 教你择吉入祥宅">2吉宅风水必知 教你择吉入祥宅</a></h1>
                </header>

                <div class="entry-content">
<footer class="post-info">
        <abbr class="published" title="2019-04-30T08:37:00+08:00">
                Published: 二 30 四月 2019
        </abbr>

        <address class="vcard author">
                By                         <a class="url fn" href="/author/andrew.html">andrew</a>
        </address>
<p>In <a href="/category/feng-shui.html">风水</a>.</p>

</footer><!-- /.post-info -->                <ul>
<li><a href="https://china-testing.github.io/practices.html">python测试开发项目实战-目录</a></li>
<li><a href="https://china-testing.github.io/python_books.html">python工具书籍下载-持续更新</a></li>
</ul>
<h3 id="_1">房屋选址</h3>
<p>房屋选址关乎整个房屋的吉凶，从而影响房主人一家的福祸。因此，房屋选址首先应该遵循择吉原则，以避凶祸。</p>
<ul>
<li>择吉气原则择</li>
</ul>
<p>吉气原则主要指选择拥有吉祥气场的地块，是从整体方面来说的。看一个地方的气场是否吉祥，应该看看四周的整体环境，如山水如何，植物如何，阳光是否充足等。</p>
<ul>
<li>择吉地原则</li>
</ul>
<p>择吉地原则首先应该平整、地质稳，而低洼湿地、偏高山顶、干燥沙地、河水冲刷地等，都为凶地。此外，吉地还应有良好的地形，地形以方正为最吉，呈前窄后宽的梯形为次吉。地形若呈长方形，南北较长则吉，东西较长则凶。而其他如T字形、十字形、三角形等不方正的地形，均为凶相。这是因为，地形不方正，造成某个方位缺角，势必会破坏八卦、五行、阴阳的原理，从而影响房主的健康和运气。</p>
<ul>
<li>择吉水原则</li>
</ul>
<p>择吉水原则主要指选择拥有形状良好、水质良好、没有犯“冲煞”水源的地块。圆形或半圆形的水源最为吉利，弯弯曲曲的水流也为吉 …</p>
                <a class="readmore" href="/fengshui_yijing2.html">read more</a>
                </div><!-- /.entry-content -->
            </article></li>

            <li><article class="hentry">
                <header>
                    <h1><a href="/fengshui_yijing3.html" rel="bookmark"
                           title="Permalink to 家居布置风水3-健康和幸福的前提">家居布置风水3-健康和幸福的前提</a></h1>
                </header>

                <div class="entry-content">
<footer class="post-info">
        <abbr class="published" title="2019-04-30T08:30:00+08:00">
                Published: 二 30 四月 2019
        </abbr>

        <address class="vcard author">
                By                         <a class="url fn" href="/author/andrew.html">andrew</a>
        </address>
<p>In <a href="/category/feng-shui.html">风水</a>.</p>

</footer><!-- /.post-info -->                <ul>
<li><a href="https://china-testing.github.io/practices.html">python测试开发项目实战-目录</a></li>
<li><a href="https://china-testing.github.io/python_books.html">python工具书籍下载-持续更新</a></li>
</ul>
<h2 id="_1">客厅布局</h2>
<p>在家居风水中,客厅布局是非常重要的一部分。客厅布局是否合理,直接影响着家庭成员的身体健康及家庭和睦。所以无论从哪个方面考虑,都不能忽视客厅的布局。沙发、茶几、地毯和墙壁装饰等都是客厅的重要组成部分,如何将它们摆放好,有很大的学问。</p>
<ul>
<li>沙发</li>
</ul>
<p>沙发是与人最亲近的家具,有用来休息、闲谈及会客的功能。不同款式的沙发,既能体现屋主的喜好,还能影响房屋的气氛。从住宅风水角度讲,它也占据了一个很重要的地位。所以沙发的摆放很有讲究。</p>
<p>【沙发背后宜有靠】所谓有靠是取其有靠山之意,背靠实体墙,房主无后顾之忧。如果沙发背后是窗门,并无实墙可靠,没有安全感不说,背后空荡荡的,在风水上是散财之兆,难以旺人旺财。</p>
<p>【沙发套数讲究】客厅沙发套数很重要,最忌一套半,或是方圆两组沙发并用,这样会导致家庭成员失和,生嫌隙。</p>
<p>【沙发应摆在房屋的吉方】沙发是家庭成员日常坐卧的地方,摆在吉利方位,可以使家庭成员沾吉方的旺气,身体康寿,诸事顺利。而哪个方位是住宅的吉方,这需要视具体情况而定。如果住宅属于东四宅,那么客厅的正东 …</p>
                <a class="readmore" href="/fengshui_yijing3.html">read more</a>
                </div><!-- /.entry-content -->
            </article></li>

            <li><article class="hentry">
                <header>
                    <h1><a href="/fengshui_yijing1.html" rel="bookmark"
                           title="Permalink to 风水基础知识">风水基础知识</a></h1>
                </header>

                <div class="entry-content">
<footer class="post-info">
        <abbr class="published" title="2019-04-30T08:01:00+08:00">
                Published: 二 30 四月 2019
        </abbr>

        <address class="vcard author">
                By                         <a class="url fn" href="/author/andrew.html">andrew</a>
        </address>
<p>In <a href="/category/feng-shui.html">风水</a>.</p>

</footer><!-- /.post-info -->                <ul>
<li><a href="https://china-testing.github.io/practices.html">python测试开发项目实战-目录</a></li>
<li><a href="https://china-testing.github.io/python_books.html">python工具书籍下载-持续更新</a></li>
</ul>
<h2 id="_1">风水基础知识</h2>
<h3 id="_2">八卦</h3>
<p>八卦是中国古代的一套有象征意义的符号。“—”代表阳，用“--”代表阴，用三个这样的符号组成八种形式，叫做八卦，用来象征各种自然现象和人情物事。</p>
<p>最初，卦是古代劳动人民通过测量太阳的位置，从而知晓季节、记录劳作规律的手段。“卦”字的右边——“卜”是象形字，表示在地上竖杆子，右边那一点是太阳的影子。左边的“圭”则代表尺子，用来测量影子的长度和位置。通过这样的测量方式，劳动人民掌握了太阳运行的规律，从而总结出很多耕种收获作物的经验。</p>
<p>八卦的衍生，是历代很多学者精心研究的结果。相传先天八卦是伏羲由河图推演而来的。伏羲认为，河图由黑白两种图案组成，主要表现了阴阳的相生相克，并共同孕育出万物的宇宙本源。于是伏羲绘制了太极图来表现宇宙本源，用八卦来显示万物的属性。太极图就是一个圆，其中以圆心为界，两个相等的鱼形表示阴阳。阴鱼用黑色，阳鱼用白色。为了赋予太极图更多的象征意义，伏羲另用“─”来表示阳，用“--”来表示阴，这就是“两仪”；如果给两仪各加一个阴或阳 …</p>
                <a class="readmore" href="/fengshui_yijing1.html">read more</a>
                </div><!-- /.entry-content -->
            </article></li>

            <li><article class="hentry">
                <header>
                    <h1><a href="/data_warehouse_quick6.html" rel="bookmark"
                           title="Permalink to 数据仓库快速入门教程6-OLAP">数据仓库快速入门教程6-OLAP</a></h1>
                </header>

                <div class="entry-content">
<footer class="post-info">
        <abbr class="published" title="2019-04-29T08:36:00+08:00">
                Published: 一 29 四月 2019
        </abbr>

        <address class="vcard author">
                By                         <a class="url fn" href="/author/andrew.html">andrew</a>
        </address>
<p>In <a href="/category/da-shu-ju.html">大数据</a>.</p>

</footer><!-- /.post-info -->                <ul>
<li><a href="https://china-testing.github.io/practices.html">python测试开发项目实战-目录</a></li>
<li><a href="https://china-testing.github.io/python_books.html">python工具书籍下载-持续更新</a></li>
</ul>
<h2 id="_1">什么是在线分析处理？</h2>
<p>OLAP(Online Analytical Processing)允许用户同时分析来自多个数据库系统的信息。 这项技术使分析师能够从不同的角度提取和查看业务数据。</p>
<p>分析师经常需要分组，汇总和加入数据。 关系数据库中的这些操作是资源密集型的。 使用OLAP数据可以预先计算和预先聚合，从而加快分析速度。</p>
<p>OLAP数据库分为一个或多个多维数据集。 立方体的设计使得创建和查看报告变得容易。</p>
<h2 id="olap">OLAP多维数据集：</h2>
<p><a href="https://www.guru99.com/images/1/022218_1238_WhatisOLAPO1.png"><img alt="image" src="http://upload-images.jianshu.io/upload_images/12713060-5f6d0be658050d2a.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240"></a> </p>
<p>OLAP的核心是OLAP多维数据集。 OLAP多维数据集是为快速数据分析而优化的数据结构。</p>
<p>OLAP多维数据集由称为度量的数字事实组成，这些度量按维度分类。 OLAP Cube也称为<strong>超立方体</strong> 。</p>
<p>通常，使用简单的电子表格执行数据操作和分析，其中数据值以行和列格式排列。 这是二维数据的理想选择。 但是，OLAP包含多维数据，数据通常从不同且不相关的源获取。 使用电子表格不是最佳选择。 多维数据集可以以逻辑和有序的方式存储和分析多维数据。</p>
<p><strong>它是如何工作的？</strong></p>
<p>数据仓库将从多个数据源和格式中提取信息，如文本文件，Excel工作表，多媒体文件等。</p>
<p>提取的数据被清理和转换。 将数据加载到OLAP服务器(或OLAP多维数据集)中，在这里预先计算信息以供进一步分析。</p>
<h2 id="olap_1">OLAP的基本分析操作</h2>
<p>OLAP中的四种分析操作是：</p>
<ol>
<li>Roll-up 汇聚</li>
<li>Drill-down 下沉</li>
<li>Slice …</li></ol>
                <a class="readmore" href="/data_warehouse_quick6.html">read more</a>
                </div><!-- /.entry-content -->
            </article></li>

            <li><article class="hentry">
                <header>
                    <h1><a href="/data_warehouse_quick5.html" rel="bookmark"
                           title="Permalink to 数据仓库快速入门教程5-ETL与ELT的差异">数据仓库快速入门教程5-ETL与ELT的差异</a></h1>
                </header>

                <div class="entry-content">
<footer class="post-info">
        <abbr class="published" title="2019-04-29T08:35:00+08:00">
                Published: 一 29 四月 2019
        </abbr>

        <address class="vcard author">
                By                         <a class="url fn" href="/author/andrew.html">andrew</a>
        </address>
<p>In <a href="/category/da-shu-ju.html">大数据</a>.</p>

</footer><!-- /.post-info -->                <ul>
<li><a href="https://china-testing.github.io/practices.html">python测试开发项目实战-目录</a></li>
<li><a href="https://china-testing.github.io/python_books.html">python工具书籍下载-持续更新</a></li>
</ul>
<h2 id="etl">什么是ETL？</h2>
<p>ETL是Extract，Transform和Load的缩写。 在此过程中，ETL工具从不同的RDBMS源系统中提取数据，然后转换数据，如应用计算，连接等，然后将数据加载到数据仓库系统中。</p>
<p>在ETL中，数据是从源流向目标。 在ETL过程中，转换引擎负责数据更改。</p>
<p><img alt="图片.png" src="https://upload-images.jianshu.io/upload_images/12713060-f2e6a5370a702775.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240"></p>
<h2 id="elt">什么是ELT？</h2>
<p>ELT是用于查看数据移动。 ELT不在数据写入之前转换数据，而是让目标系统进行转换。 数据首先复制到目标，然后转换。</p>
<p>ELT通常与无Sql数据库(如Hadoop集群，数据设备或云)一起使用。</p>
<p><a href="https://www.guru99.com/images/1/022218_0954_ETLvsELTMus2.png"><img alt="image" src="http://upload-images.jianshu.io/upload_images/12713060-9f235d22cafb2b43.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240"></a></p>
<p>ETL与ELT之间的区别</p>
<table>
<thead>
<tr>
<th align="center">参数</th>
<th align="center">ETL</th>
<th align="center">ELT</th>
</tr>
</thead>
<tbody>
<tr>
<td align="center">处理</td>
<td align="center">数据在staging服务器上转换，然后传输到Datawarehouse DB。</td>
<td align="center">数据保留在Datawarehouse的DB中。</td>
</tr>
<tr>
<td align="center">代码</td>
<td align="center">计算密集型转换;少量数据</td>
<td align="center">用于大量数据</td>
</tr>
<tr>
<td align="center">转型</td>
<td align="center">转换在ETL服务器/staging区域中完成。</td>
<td align="center">转换在目标系统中执行</td>
</tr>
<tr>
<td align="center">时间负载</td>
<td align="center">数据首先加载到暂存中，然后加载到目标系统中。 时间密集。</td>
<td align="center">数据仅一次加载到目标系统。 更快。</td>
</tr>
<tr>
<td align="center">时间转换</td>
<td align="center">ETL过程需要等待转换完成 …</td></tr></tbody></table>
                <a class="readmore" href="/data_warehouse_quick5.html">read more</a>
                </div><!-- /.entry-content -->
            </article></li>

            <li><article class="hentry">
                <header>
                    <h1><a href="/data_warehouse_quick4.html" rel="bookmark"
                           title="Permalink to 数据仓库快速入门教程4-ETL">数据仓库快速入门教程4-ETL</a></h1>
                </header>

                <div class="entry-content">
<footer class="post-info">
        <abbr class="published" title="2019-04-29T08:34:00+08:00">
                Published: 一 29 四月 2019
        </abbr>

        <address class="vcard author">
                By                         <a class="url fn" href="/author/andrew.html">andrew</a>
        </address>
<p>In <a href="/category/da-shu-ju.html">大数据</a>.</p>

</footer><!-- /.post-info -->                <ul>
<li><a href="https://china-testing.github.io/practices.html">python测试开发项目实战-目录</a></li>
<li><a href="https://china-testing.github.io/python_books.html">python工具书籍下载-持续更新</a></li>
</ul>
<h2 id="etl">什么是ETL？</h2>
<p>ETL是Extract，Transform和Load的缩写。 在此过程中，ETL工具从不同的RDBMS源系统中提取数据，然后转换数据，如应用计算，连接等，然后将数据加载到数据仓库系统中。</p>
<p>ETL流程需要来自各种利益相关方（包括开发人员，分析师，测试人员，高级管理人员)的积极参与.为了保持其作为决策者工具的价值，数据仓库系统需要随业务变化而变化。 ETL是数据仓库系统的重复活动(每日，每周，每月)，需要灵活，自动化且有良好的文档。</p>
<h2 id="etl_1">你为什么需要ETL？</h2>
<p>在组织中采用ETL的原因有很多：</p>
<ul>
<li>它可以帮助公司分析业务数据，从而做出关键业务决策。</li>
<li>事务数据库无法回答ETL可以回答的复杂业务问题。</li>
<li>数据仓库提供公共数据存储库</li>
<li>ETL提供了将数据从各种源移动到数据仓库的方法。</li>
<li>随着数据源的变化，数据仓库将自动更新。</li>
<li>精心设计和记录的ETL系统对于数据仓库项目的成功几乎是必不可少的。</li>
<li>允许验证数据转换，聚合和计算规则。</li>
<li>ETL过程允许源和目标系统之间的样本数据比较。</li>
<li>ETL过程可以执行复杂的转换，并需要额外的区域来存储数据。</li>
<li>ETL有助于将数据迁移到数据仓库中。 转换为各种格式和类型。</li>
<li>ETL是用于访问和操作源数据到目标数据库的预定义过程。</li>
<li>ETL为业务提供深刻的历史背景。</li>
<li>它有助于提高生产力。</li>
</ul>
<h2 id="etl_2">数据仓库中的ETL过程</h2>
<p>ETL分为3个步骤</p>
<p><img alt="图片.png" src="https://upload-images.jianshu.io/upload_images/12713060-d8e9219ab0447c8e.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240"></p>
<h3 id="_1">提取</h3>
<p>在此步骤中，将数据从源系统提取到暂存区域 …</p>
                <a class="readmore" href="/data_warehouse_quick4.html">read more</a>
                </div><!-- /.entry-content -->
            </article></li>
                </ol><!-- /#posts-list -->
<p class="paginator">
    Page 1 / 21
        <a href="/index2.html">&raquo;</a>
</p>
                </section><!-- /#content -->
        <section id="extras" class="body">
                <div class="blogroll">
                        <h2>links</h2>
                        <ul>
                            <li><a href="https://china-testing.github.io/testing_training.html">自动化性能接口测试线上及深圳培训与项目实战 qq群：144081101 591302926</a></li>
                            <li><a href="http://blog.sciencenet.cn/blog-2604609-1112306.html">pandas数据分析scrapy爬虫 521070358 Py人工智能pandas-opencv 6089740</a></li>
                            <li><a href="http://blog.sciencenet.cn/blog-2604609-1112306.html">中医解梦看相八字算命qq群 391441566 csdn书籍下载-python爬虫 437355848</a></li>
                        </ul>
                </div><!-- /.blogroll -->
        </section><!-- /#extras -->

        <footer id="contentinfo" class="body">
                <address id="about" class="vcard body">
                Proudly powered by <a href="http://getpelican.com/">Pelican</a>, which takes great advantage of <a href="http://python.org">Python</a>.
                </address><!-- /#about -->

                <p>The theme is by <a href="http://coding.smashingmagazine.com/2009/08/04/designing-a-html-5-layout-from-scratch/">Smashing Magazine</a>, thanks!</p>
        </footer><!-- /#contentinfo -->

</body>
</html>