跳到置頂內容 跳到主要內容 跳到置底內容 跳到置右內容 6e4e848b-1563-4739-97b9-a2d52903d313
:::
iPAS專業工程師考試
專業工程師考試

巨量資料分析師

:::

鑑定制度與評鑑內容

鑑定制度架構(更新日期:2024/01/17)

專業級等

建議報考對象

考試科目

評鑑方法

通過及授證標準

Level 1

初級巨量

資料分析師

  1. 具備RPython的基礎知識
  2. 具備程式語言、機率與統計、資料探勘或機器學習等基礎知識尤佳

1.資料導向程式設計

2.資料處理與分析概論

考試時間每科75分鐘

電腦測驗

每科各

單選50

       每科100分,單科成績達到70分為合格

       70分之單科成績,可保留三年度

       一次報考同一級等的所有考科,平均達70分得視為及格,但單科成績不得低於60

Level 2

中級巨量

資料分析師

  1. 大學畢業
  2. 具資料分析相關經驗1()以上
  3. 具初級巨量資料分析師證書

1.資料分析與資料科學 (學科)

考試時間120分鐘

電腦測驗

單選50

       每科100分,單科成績達到70分表示及格

       70分之單科成績,可保留三年度

       兩科皆通過始可申請證書

2.巨量資料分析實作(術科)

考試時間180分鐘

上機實作

題組3~4

註1:建議報考資格為「建議項目」,並非須具備該資格才可參加鑑定考試。

註2:本鑑定可以越級考試,並無限制必須通過初級才能報考中級,考生可以依照評鑑內容及主題的難易度來判斷適合之級等。

 

初級考試評鑑內容(更新日期:2024/01/17)

科目

評鑑主題

評鑑內容

知識點

科目一:

資料導向程式設計

1.資料架構

(50%)

1-1.資料類型與物件(15%)

-共通

  - 變數命名、賦值、作用域

-Python

  - 變數型態:整數(int)、浮點數(float)、字串(str)、布林值(bool)

  - 容器型態:串列(list)、元組(tuple)、字典(dict)、集合(set)

  - 物件型態:類別(class)的定義與實例化、物件導向程式設計(OOP)的基本概念(封裝、繼承、多型)

-R

  - 變數型態:向量(numericintegercharacterlogical)、因子(factor)、日期與時間(Date, POSIXct, POSIXlt)

  - 容器型態:向量(vector)、列表(list)、數據框(data.frame)、矩陣(matrix)、陣列(array)

1-2.資料庫概念(NoSQL) (20%)

- 資料庫介紹

  - 類型/用途/案例/CRUD原理

  - sql vs nosql

- sql類語法(mysql作為資料庫)

  - 基礎語法介紹

  - 進階語法介紹

  - 資料分析常用語法(以讀取(Read)資料之語法為主)

- nosql類語法(mongodb資料庫)

  - 基礎語法介紹

  - 進階語法介紹

  - 資料分析常用語法(以讀取(Read)資料之語法為主)

1-3.資料匯入與匯出 (15%)

- CSVXLSXXMLJSONTXT等資料特性、使用場景、資料內容等

- PythonR中,資料匯入、匯出、資料結構轉換等

 

科目

評鑑主題

評鑑內容

知識點

科目一:

資料導向程式設計

2.程式實作基礎(50%)

2-1.程式設計類型 (20%)

- 編程程式(programming paradigms)的概念

- 資料導向程式設計(data-driven programming)的概念

- 程式設計撰寫時,要注意的事項、原則

- 資料分析程式撰寫時,需要注意的事項

-Python

  - 物件導向程式設計(OOP)的基本概念(封裝、繼承、多型)

  - 向量化及隱式迴圈用法:pd.apply pd.map、匿名函式語句(lambda)

-R

  -apply 系列函數(lapplysapply )

2-2.函數與控制敘述 (20%)

-Python

  - 布林值與邏輯運算:布林值(True, False)、邏輯運算子(and, or, not)、比較運算子(==, !=, <, >, <=, >=)

  - 條件判斷:ifelifelse 語句、巢狀條件語句、條件表達式(三元運算表達式)

  - 迴圈: for 迴圈(遍歷列表、字典、集合、dataframe)while 迴圈、迴圈控制(break, continue, pass)pd.apply pd.map

  - 函數:函式定義(def)、參數、回傳值、匿名函式語句(lambda)、函式的作用域(localnonlocalglobal)

-R

  - 布林值與邏輯運算:布林值(TRUE, FALSE)、邏輯運算子(&, |, !)、比較運算子(==, !=, <, >, <=, >=)

  - 條件判斷:ifelse 語句、巢狀條件語句、ifelse函數

  - 迴圈:for 迴圈(遍歷向量、列表、數據框等)while 迴圈、迴圈控制語句(break next)apply 系列函數(lapplysapply )

  - 函數:函式定義、參數、回傳值、匿名函式語句、函式的作用域與環境

2-3.程式除錯與效能提升方法 (10%)

- 程式碼偵錯基本觀念

- 程式除錯語法

    - Pythontry-except-else-finally等語句結構、常見的例外類型

    - Rtrytry-Catch 語句、trace() traceback()

- 效率優化技巧

- 資料導向程式設計特點

 

科目

評鑑主題

評鑑內容

知識點

科目二:

資料處理與分析概論

1.資料處理

(40%)

1-1.資料組織與清理 (10%)

- 資料讀取與匯出(不包括資料庫操作)

- 資料處理(空值、重複值、格式轉換等)

- 資料運算

- 資料合併(merge)

- 資料呈現與視覺化

1-2.資料摘要與彙總 (10%)

- 資料排序

- 資料分組與彙總(groupby agg)

- 資料分組呈現與視覺化

- 資料分組統計量之比較與判讀

1-3.特徵轉換與萃取 (10%)

- 資料運算

- 數值資料調整方式與運用時機(如資料標準化/正規化等)

- 類別資料編碼方式與運用時機

- 數值資料分佈偏斜處理、資料降維與PCA主成分分析等概念

1-4.巨量資料處理概念 (10%)

-分散式運算概念、分散式儲存概念

-HDFS特色、MapReduce程式基本概念等

-低結構化的文字、圖像、語音等資料前處理的基本觀念

 

科目

評鑑主題

評鑑內容

知識點

科目二:

資料處理與分析概論

2.資料分析(60%)

2-1.機率統計基礎 (30%)

- 資料類型、尺度等特性

- 敘述統計

- 資料特徵

- 資料分布與相關性

- 假設檢定與判定

2-2.探索式資料分析與非監督式學習 (15%)

[探索式資料分析]

- 資料探索與數據理解實例

- 資料繪圖與製表

[非監督式學習]

- 模型如 K平均數(K-Means)集群、階層式集群分析、頻繁型態分析等

2-3.線性模型與監督式學習 (15%)

[監督式學習]

- 迴歸與分類模型的區辨

- 模型如:羅吉斯迴歸分類、決策樹、K鄰近法、支持向量機、隨機森林

中級考試評鑑內容(更新日期:2024/01/17)

時間

科目

題型

鑑定方式

120分鐘

資料分析與資料科學(學科)

單選題50題

電腦測驗

180分鐘

巨量資料分析實作(術科)

共4大題,每題3~5小題

術科實作

 

考科1:資料分析與資料科學

考試時間120分鐘、單選50題

評鑑主題

評鑑內容

知識點

1.進階資料處理、分析與預測建模 (40%) 

1-1. 進階特徵工程(15%)

進階特徵編碼與優化、特徵萃取方法之比較、特徵挑選之比較、特徵評估

1-2. 視覺化與解析建模(10%)

視覺化與特徵工程、視覺化與模型釋義

1-3. 時空訊號資料處理與預測建模(15%)

序列分割、序列分解、序列表達、序列模式、序列集群、序列分類、序列預測、異常偵測

2.機器學習與深度學習(40%)

2-1.模型選擇與調校(15%)

模型績效評量與視覺化、參數估計最佳化與求解方法、集成模型

2-2.深度學習(15%)

多層感知機、卷積神經網路、遞歸神經網路

2-3.文字序列資料、長短期記憶、注意力機制與大基礎模型(10%)

文字序列資料前處理、長短期記憶、注意力機制、變形金剛網路(Transformer)、大語言模型、大視覺模型

3.智慧製造應用(20%)

3-1.設備故障預診與健康管理(10%)

機台狀態監測、感測器訊號處理、設備故障診斷、設備故障預測

3-2.品質與製程控制(10%)

統計製程管制、工程製程控制、結果檢驗、時空模式分析、異常偵測與預警、控制參數優化、根因分析

 

考科2:巨量資料分析實作 

考試時間180分鐘,術科考試以R或Python實作皆可

原則:測驗考生將理論化為實作之能力

評鑑主題

評鑑內容

1.資料處理與分析

1-1. 資料物件載入與匯出

1-2. 資料導向程式設計

1-3. 資料清理與探索

1-4. 資料視覺化

2.機器學習

2-1. 隨機誤差模型與最佳化

2-2. 進階資料解析建模

2-3. 非監督式與監督式學習

 


:::
主辦單位
主辦單位
承辦單位
承辦單位
執行單位
執行單位
聯絡資訊

電子郵件:ipas_service@mail.csf.org.tw

線上客服:https://lin.ee/XzS9nul

通訊地址:105臺北市松山區八德路三段32號8樓 CSF產業人才鑑定考務中心

© 2024 巨量資料分析師能力鑑定官方網站, All Rights Reserved.
瀏覽器建議使用:Chrome、Safari 及 Edge,1024x768 以上解析度瀏覽;維護單位:工業技術研究院 產業學院。
通過A無障礙網頁檢測