在Oracle中，PARALLEL（并行）方式最大化調用計算機資源來成倍提高數據分析效率。

1．用途

2．語法

/*+parallel(table_short_name,cash_number)*/

這個可以加到insert、delete、update、select的后面來使用（和rule的用法差不多，有機會再分享rule的用法）

開啟parallel功能的語句是：

alter session enable parallel dml;

這個語句是DML語句哦，如果在程序中用，用execute的方法打開。

===========================================================================================================================

一、并行查詢

并行查詢允許將一個sql select語句劃分為多個較小的查詢，每個部分的查詢并發地運行，然后將各個部分的結果組合起來，提供最終的結果，多用于全表掃描，索引全掃描等，大表的掃描和連接、創建大的索引、分區索引掃描、大批量插入更新和刪除
?
1. ? ?啟用并行查詢
SQL> ALTER TABLE T1 PARALLEL;
告知oracle，對T1啟用parallel查詢，但并行度要參照系統的資源負載狀況來確定。
利用hints提示，啟用并行，同時也可以告知明確的并行度，否則oracle自行決定啟用的并行度，這些提示只對該sql語句有效。
SQL> select /*+ parallel(t1 8) */ count(*)from t1;
?
SQL> select degree from user_tables where table_name='T1';
DEGREE
--------------------
? DEFAULT
?
并行度為Default，其值由下面2個參數決定
SQL> show parameter cpu
?
NAME ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?TYPE ? ? ? VALUE
----------------------------------------------- ------------------------------
cpu_count ? ? ? ? ? ? ? ? ? ? ? ? ? integer ? ?2
parallel_threads_per_cpu ? ? ? ? ? ?integer ? ?2
?
cpu_count表示cpu數
parallel_threads_per_cpu表示每個cpu允許的并行進程數
default情況下，并行數為cpu_count*parallel_threads_per_cpu
?
2. ? ?取消并行設置
SQL> alter table t1 noparallel;
SQL> select degree from user_tables wheretable_name='T1';
?
DEGREE
----------------------------------------
? ? ? ? 1
?
3. ? ?數據字典視圖
v$px_session
sid：各個并行會話的sid
qcsid：query coordinator sid,查詢協調器sid
?
二、并行dml
并行dml包括insert，update，delete，merge，在pdml期間，oracle可以使用多個并行執行服務器來執行insert，update，delete，merge，多個會話同時執行，同時每個會話(并發進程)都有自己的undo段，都是獨立的一個事務，這些事務要么由pdml協調器進程提交，要么都rollback。
在一個有充足I/o帶寬的多cpu主機中，對于大規模的dml，速度可能會有很大的提升，尤其是在大型的數據倉庫環境中。
并行dml需要顯示的啟用
SQL> alter session enable parallel dml;
?
Disable并行dml
SQL> alter session disable parallel dml;
?
三、并行ddl
并行ddl提供了dba使用全部機器資源的能力，常用的pddl有
create table as select ……
create index
alter index rebuild
alter table move
alter table split
在這些sql語句后面加上parallel子句
例
SQL> alter table t1 move parallel;
Table altered
SQL> create index T1_IDX on T1 (OWNER,OBJECT_TYPE)
?2 ? tablespace SYSTEM
3 ? ? ? ?parallel;
4 ? ? ? ?；

并行的實現機制是：?首先，Oracle?會創建一個進程用于協調并行服務進程之間的信息傳遞，這個協調進程將需要操作的數據集（比如表的數據塊）分割成很多部分，稱為并行處理單元，然后并行協調進程給每個并行進程分配一個數據單元。比如有四個并行服務進程，他們就會同時處理各自分配的單元，當一個并行服務進程處理完畢后，協調進程就會給它們分配另外的單元，如此反復，直到表上的數據都處理完畢，最后協調進程負責將每個小的集合合并為一個大集合作為最終的執行結果，返回給用戶。

并行處理的機制實際上就是把一個要掃描的數據集分成很多小數據集，Oracle?會啟動幾個并行服務進程同時處理這些小數據集，最后將這些結果匯總，作為最終的處理結果返回給用戶。

這種數據并行處理方式在OLAP系統中非常有用，OLAP系統的表通常來說都是非常大，如果系統的CPU比較多，讓所有的CPU共同來處理這些數據，效果就會比串行執行要高的多。

然而對于OLTP系統，通常來講，并行并不合適，原因是OLTP系統上幾乎在所有的SQL操作中，數據訪問路勁基本上以索引訪問為主，并且返回結果集非常小，這樣的SQL?操作的處理速度一般非常快，不需要啟用并行。

二．?并行處理的機制

????????????????當Oracle?數據庫啟動的時候，實例會根據初始化參數：

????????????????????????????????PARALLEL_MIN_SERVERS=n

????????????????的值來預先分配n個并行服務進程，當一條SQL?被CBO判斷為需要并行執行時發出SQL的會話進程變成并行協助進程，它按照并行執行度的值來分配進程服務器進程。

????????????????首先協調進程會使用ORACLE?啟動時根據參數：?parallel_min_servers=n的值啟動相應的并行服務進程，如果啟動的并行服務器進程數不足以滿足并行度要求的并行服務進程數，則并行協調進程將額外啟動并行服務進程以提供更多的并行服務進程來滿足執行的需求。?然后星星協調進程將要處理的對象劃分成小數據片，分給并行服務進程處理；并行服務進程處理完畢后將結果發送給并行協調進程，然后由并行協調進程將處理結果匯總并發送給用戶。

????????????????剛才講述的是一個并行處理的基本流程。?實際上，在一個并行執行的過程中，還存在著并行服務進程之間的通信問題。

????????????????在一個并行服務進程需要做兩件事情的時候，它會再啟用一個進程來配和當前的進程完成一個工作，比如這樣的一條SQL語句：

????????????????Select * from employees order by last_name;

???????????????

????????????????假設employees表中last_name?列上沒有索引，并且并行度為4，此時并行協調進程會分配4個并行服務進程對表employees進行全表掃描操作，因為需要對結果集進行排序，所以并行協調進程會額外啟用4個并行服務進程，用于處理4個進程傳送過來的數據，這新啟用的用戶處理傳遞過來數據的進程稱為父進程，用戶傳出數據（最初的4個并行服務進程）成為子進程，這樣整個并行處理過程就啟用了8個并行服務進程。?其中每個單獨的并行服務進程的行為叫作并行的內部操作，而并行服務進程之間的數據交流叫做并行的交互操作。

????????????????這也是有時我們發現并行服務進程數量是并行度的2倍，就是因為啟動了并行服務父進程操作的緣故。

三.?讀懂一個并行處理的執行計劃

CREATE TABLE emp2 AS SELECT * FROM employees;

ALTER TABLE emp2 PARALLEL 2;

EXPLAIN PLAN FOR

??SELECT SUM(salary) FROM emp2 GROUP BY department_id;

SELECT PLAN_TABLE_OUTPUT FROM TABLE(DBMS_XPLAN.DISPLAY());

--------------------------------------------------------------------------------------------------------

--------------------------------------------------------------------------------------------------------

|???0?| SELECT STATEMENT?????????|??????????|???107 |??2782 |?????3 (34)??|????????|??????|????????????|

|???1 |??PX COORDINATOR??????????|??????????|???????|???????|?????????????|????????|??????|????????????|

|???2 |???PX SEND QC (RANDOM)????| :TQ10001 |???107 |??2782 |?????3 (34)??|??Q1,01 |?P->S?| QC (RAND)??|

|???3 |????HASH GROUP BY?????????|??????????|???107 |??2782 |?????3 (34)??|??Q1,01 | PCWP |????????????|

|???4 |?????PX RECEIVE???????????|??????????|???107 |??2782 |?????3 (34)??|??Q1,01 | PCWP |????????????|

|???5 |??????PX SEND HASH????????| :TQ10000 |???107 |??2782 |?????3 (34)??|??Q1,00?| P->P?| HASH???????|

|???6 |???????HASH GROUP BY??????|??????????|???107 |??2782 |?????3 (34)??|??Q1,00 |?PCWP?|????????????|

|???7 |????????PX BLOCK ITERATOR |??????????|???107 |??2782 |?????2 (0)???|??Q1,00 |?PCWP?|????????????|

|???8 |?????????TABLE ACCESS FULL| EMP2?????|???107 |??2782 |?????2 (0)???|??Q1,00 |?PCWP?|????????????|

--------------------------------------------------------------------------------------------------------

The table EMP2 is scanned in parallel by one set of slaves while the aggregation for the GROUP BY is done by the second set. The PX BLOCK ITERATOR row source represents the splitting up of the table EMP2 into pieces so as to divide the scan workload between the parallel scan slaves. The PX SEND and PX RECEIVE row sources represent the pipe that connects the two slave sets as rows flow up from the parallel scan, get repartitioned through the HASH table queue, and then read by and aggregated on the top slave set. The PX SEND QC row source represents the aggregated values being sent to the QC in random (RAND) order. The PX COORDINATOR row source represents the QC or Query Coordinator which controls and schedules the parallel plan appearing below it in the plan tree.

????????????????上面這段文字是從Oracle?聯機文檔上蕩下來的。

http://download.oracle.com/docs/cd/E11882_01/server.112/e10821/ex_plan.htm#PFGRF94687

通過執行計劃，我們來看一下它的執行步驟：

????????????????（1）并行服務進程對EMP2表進行全表掃描。

????????????????（2）并行服務進程以ITERATOR（迭代）方式訪問數據塊，也就是并行協調進程分給每個并行服務進程一個數據片，在這個數據片上，并行服務進程順序地訪問每個數據塊（Iterator），所有的并行服務進程將掃描的數據塊傳給另一組并行服務進程（父進程）用于做Hash Group操作。

????????????????（3）并行服務父進程對子進程傳遞過來的數據做Hash Group操作。

????????????????（4）并行服務進程（子進程）將處理完的數據發送出去。

????????????????（5）并行服務進程（父進程）接收到處理過的數據。

????????????????（6）合并處理過的數據，按照隨即的順序發給并行協調進程（QC：Query Conordinator）。

????????????????（7）并行協調進程將處理結果發給用戶。

當使用了并行執行，SQL的執行計劃中就會多出一列：in-out。?該列幫助我們理解數據流的執行方法。?它的一些值的含義如下：

Parallel to Serial（P->S）:?表示一個并行操作發送數據給一個串行操作，通常是并行incheng將數據發送給并行調度進程。

Parallel to Parallel（P->P）：表示一個并行操作向另一個并行操作發送數據，疆場是兩個從屬進程之間的數據交流。

Parallel Combined with parent(PCWP):?同一個從屬進程執行的并行操作，同時父操作也是并行的。

Parallel Combined with Child(PCWC):?同一個從屬進程執行的并行操作，子操作也是并行的。

Serial to Parallel（S->P）:?一個串行操作發送數據給并行操作，如果select?部分是串行操作，就會出現這個情況。

如何啟用并行？

?可以用hint、alter session或者設置對象并行屬性三種方式設置啟用并行。三種方式任意一種就可以使并行生效，如果多種方式同時存在的話，則優先級順序是：hint -> alter session -> table/index degree。

1．? 用途

強行啟用并行度來執行當前SQL。這個在Oracle 9i之后的版本可以使用，之前的版本現在沒有環境進行測試。也就是說，加上這個說明，可以強行啟用Oracle的多線程處理功能。舉例的話，就像電腦裝了多核的CPU，但大多情況下都不會完全多核同時啟用（2核以上的比較明顯），使用parallel說明，就會多核同時工作，來提高效率。

但本身啟動這個功能，也是要消耗資源與性能的。所有，一般都會在返回記錄數大于100萬時使用，效果也會比較明顯。

2．? 語法

/*+parallel(table_short_name,cash_number)*/

這個可以加到insert、delete、update、select的后面來使用（和rule的用法差不多，有機會再分享rule的用法）

開啟parallel功能的語句是：

alter session enable parallel dml;

這個語句是DML語句哦，如果在程序中用，用execute的方法打開。

3．? 實例說明

用ERP中的transaction來說明下吧。這個table記錄了所有的transaction，而且每天數據量也算相對比較大的（根據企業自身業務量而定）。假設我們現在要查看對比去年一年當中每月的進、銷情況，所以，一般都會寫成：

select to_char(transaction_date,'yyyymm') txn_month,

?????? sum(

??????? decode(

??????????? sign(transaction_quantity),1,transaction_quantity,0
????????????? )

????????? ) in_qty,

?????? sum(

??????? decode(

??????????? sign(transaction_quantity),-1,transaction_quantity,0
????????????? )

????????? ) out_qty

? from mtl_material_transactions mmt

where transaction_date >= add_months(

??????????????????????????? to_date(????

??????????????????????????????? to_char(sysdate,'yyyy')||'0101','yyyymmdd'),

??????????????????????????????? -12)

?? and transaction_date <= add_months(

??????????????????????????? to_date(

??????????????????????????????? to_char(sysdate,'yyyy')||'1231','yyyymmdd'),

??????????????????????????????? -12)

group by to_char(transaction_date,'yyyymm')?

這個SQL執行起來，如果transaction_date上面有加index的話，效率還算過的去；但如果沒有加index的話，估計就會半個小時內都執行不出來。這是就可以在select 后面加上parallel說明。例如：
select /*+parallel(mmt,10)*/
?????? to_char(transaction_date,'yyyymm') txn_month,

...

這樣的話，會大大提高執行效率。如果要將檢索出來的結果insert到另一個表tmp_count_tab的話，也可以寫成：
insert /*+parallel(t,10)*/
? into tmp_count_tab

(

??? txn_month,

??? in_qty,

??? out_qty

)

select /*+parallel(mmt,10)*/
?????? to_char(transaction_date,'yyyymm') txn_month,

...

插入的機制和檢索機制差不多，所以，在insert后面加parallel也會加速的。關于insert機制，這里暫不說了。
Parallel后面的數字，越大，執行效率越高。不過，貌似跟server的配置還有oracle的配置有關，增大到一定值，效果就不明顯了。所以，一般用8,10,12,16的比較常見。我試過用30，發現和16的效果一樣。不過，數值越大，占用的資源也會相對增大的。如果是在一些package、function or procedure中寫的話，還是不要寫那么大，免得占用太多資源被DBA開K。
??

4．? Parallel也可以用于多表

多表的話，就是在第一后面，加入其他的就可以了。具體寫法如下：

/*+parallel(t,10) (b,10)*/

5．? 小結

關于執行效率，建議還是多按照index的方法來提高效果。Oracle有自帶的explan road的方法，在執行之前，先看下執行計劃路線，對寫好的SQL tuned之后再執行。實在沒辦法了，再用parallel方法。Parallel比較邪惡，對開發者而言，不是好東西，會養成不好習慣，導致很多bad SQL不會暴漏，SQL Tuning的能力得不到提升。我有見過某些人create table后，從不create index或primary key，認為寫SQL時加parallel就可以了。

==========================================================================================================================

Oracle Parallel Execution(并行執行)

關于Oracle?的并行執行，Oracle?官方文檔有詳細的說明：

????????????????????????????????Using Parallel Execution

http://download.oracle.com/docs/cd/E11882_01/server.112/e10837/parallel.htm#VLDBG010

This chapter covers tuning in a parallel execution environment and discusses the following topics:

Introduction to Parallel Execution
How Parallel Execution Works
Types of Parallelism
Initializing and Tuning Parameters for Parallel Execution
Tuning General Parameters for Parallel Execution
Monitoring Parallel Execution Performance
Miscellaneous Parallel Execution Tuning Tips

一．?????并行（Parallel）和OLAP系統