2020年中級(jí)經(jīng)濟(jì)師《經(jīng)濟(jì)基礎(chǔ)》考點(diǎn)及母題:數(shù)據(jù)挖掘
編輯推薦:2020年中級(jí)經(jīng)濟(jì)師《經(jīng)濟(jì)基礎(chǔ)》考點(diǎn)及母題匯總
數(shù)據(jù)挖掘
【知識(shí)點(diǎn)】
數(shù)據(jù)挖掘的相關(guān)概念如下:
1.含義:從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱藏在其中但又有潛在價(jià)值的信息和知識(shí)的過(guò)程。包含以下幾層含義:
(1)數(shù)據(jù)源必須是真實(shí)的、大量的、有噪聲的。
(2)發(fā)現(xiàn)的是用戶感興趣的知識(shí)。
(3)發(fā)現(xiàn)的知識(shí)是可接受的、可理解、可運(yùn)用的。
(4)并不要求發(fā)現(xiàn)放之四海而皆準(zhǔn)的知識(shí),只支持特定的發(fā)現(xiàn)問(wèn)題。
2.出發(fā)點(diǎn)和核心任務(wù):數(shù)據(jù)挖掘以解決實(shí)際問(wèn)題為出發(fā)點(diǎn);核心任務(wù)是對(duì)數(shù)據(jù)關(guān)系和特征進(jìn)行探索。
3.類型
(1)指導(dǎo)學(xué)習(xí)或監(jiān)督學(xué)習(xí)
監(jiān)督學(xué)習(xí)是對(duì)目標(biāo)需求的概念進(jìn)行學(xué)習(xí)和建模,通過(guò)探索數(shù)據(jù)和建立模型來(lái)實(shí)現(xiàn)從觀察變量到目標(biāo)需求的有效解釋。
(2)無(wú)指導(dǎo)學(xué)習(xí)或非監(jiān)督學(xué)習(xí)
無(wú)監(jiān)督學(xué)習(xí)沒(méi)有明確的標(biāo)識(shí)變量來(lái)表達(dá)目標(biāo)概念,主要任務(wù)是探索數(shù)據(jù)之間的內(nèi)在聯(lián)系和結(jié)構(gòu)。
4.常用的算法
(1)分類
1)含義:確定目標(biāo)對(duì)象屬于哪個(gè)預(yù)定類別,以實(shí)現(xiàn)對(duì)未來(lái)潛在的預(yù)測(cè)需求。分類技術(shù)屬于一種監(jiān)督學(xué)習(xí),即使用已知類別的訓(xùn)練數(shù)據(jù)建立分類模型的方法。
2)實(shí)際應(yīng)用:在郵件系統(tǒng)中區(qū)分出垃圾郵件,在貸款客戶中判斷出有風(fēng)險(xiǎn)客戶等。
3)常用方法:決策樹(shù)分類法、貝葉斯分類法、關(guān)聯(lián)分類法、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等。
(2)聚類分析
1)含義:把一組數(shù)據(jù)按照差異性和相似性分為幾個(gè)類別,使得同類的數(shù)據(jù)相似性盡量大,不同類的數(shù)據(jù)相似性盡可能小,跨類的數(shù)據(jù)關(guān)聯(lián)性盡可能低。聚類是一種無(wú)監(jiān)督學(xué)習(xí)。其要?jiǎng)澐值念愂俏粗?,聚類分析是根?jù)觀察學(xué)習(xí)來(lái)確定數(shù)據(jù)之間的關(guān)系。
2)實(shí)際應(yīng)用:用于客戶細(xì)分、文本歸類、結(jié)構(gòu)分組、行為跟蹤等問(wèn)題。
3)常用方法:基于劃分的方法、基于分層的方法、基于密度的方法、基于網(wǎng)格的方法和基于模型的方法。
(3)關(guān)聯(lián)分析
1)含義:是對(duì)數(shù)據(jù)集中反復(fù)出現(xiàn)的相關(guān)關(guān)系和關(guān)聯(lián)性進(jìn)行挖掘提取,從而可以根據(jù)一個(gè)數(shù)據(jù)項(xiàng)的出現(xiàn) 預(yù)測(cè)其他數(shù)據(jù)項(xiàng)的出現(xiàn)。
2)實(shí)際應(yīng)用:啤酒尿布案例,數(shù)據(jù)挖掘發(fā)現(xiàn)大型超市中購(gòu)買(mǎi)啤酒的男士經(jīng)常同時(shí)購(gòu)買(mǎi)小孩紙尿褲,基于這一發(fā)現(xiàn),超市把啤酒和紙尿褲擺放在一起,結(jié)果兩種商品的銷售量明顯提升。
3)常用方法:購(gòu)物籃分析,目的是發(fā)現(xiàn)交易數(shù)據(jù)中不同商品之間的聯(lián)系規(guī)則,讓營(yíng)銷商制定更好的營(yíng)銷策略。
(4)趨勢(shì)與演化分析
趨勢(shì)與演化分析包括數(shù)據(jù)變化趨勢(shì)、序列模式分析、周期性分析以及相似程度分析等內(nèi)容。統(tǒng)計(jì)學(xué)的回歸分析方法經(jīng)常用于這類問(wèn)題的分析。
【多選題】
下列關(guān)于數(shù)據(jù)挖掘的表述正確的有( )。
A. 數(shù)據(jù)挖掘是指從大量的、完全的、有噪聲的、清晰的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱藏在其中 但又有潛在價(jià)值的信息和知識(shí)的過(guò)程
B. 數(shù)據(jù)挖掘以解決實(shí)際問(wèn)題為出發(fā)點(diǎn)
C. 數(shù)據(jù)挖掘可以分為指導(dǎo)學(xué)習(xí)或監(jiān)督學(xué)習(xí)以及無(wú)指導(dǎo)學(xué)習(xí)或非監(jiān)督學(xué)習(xí)兩類
D. 分類技術(shù)屬于一種無(wú)監(jiān)督學(xué)習(xí)
E. 在郵件系統(tǒng)中區(qū)分出垃圾郵件數(shù)據(jù)屬于數(shù)據(jù)挖掘中的分類技術(shù)
【答案】BCE
【解析】數(shù)據(jù)挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱藏 在其中但又有潛在價(jià)值的信息和知識(shí)的過(guò)程,A 項(xiàng)錯(cuò)誤;分類技術(shù)屬于一種監(jiān)督學(xué)習(xí),即使用已知類別的 訓(xùn)練數(shù)據(jù)建立分類模型的方法,D 項(xiàng)錯(cuò)誤。
為避免考生因備考忘記考試節(jié)點(diǎn)而無(wú)法參加考試,環(huán)球網(wǎng)校提供 免費(fèi)預(yù)約短信提醒服務(wù),屆時(shí)會(huì)通知您2020中級(jí)經(jīng)濟(jì)師準(zhǔn)考證打印時(shí)間、考試時(shí)間等節(jié)點(diǎn),請(qǐng)及時(shí)預(yù)約!
以上內(nèi)容是2020年中級(jí)經(jīng)濟(jì)師《經(jīng)濟(jì)基礎(chǔ)》考點(diǎn)及母題:數(shù)據(jù)挖掘,小編為大家上傳了更多2020年中級(jí)經(jīng)濟(jì)師《經(jīng)濟(jì)基礎(chǔ)》考點(diǎn)、母題及歷年真題,點(diǎn)擊“免費(fèi)下載”按鈕后即可領(lǐng)?。?/p>
最新資訊
- 2024年中級(jí)經(jīng)濟(jì)師《經(jīng)濟(jì)基礎(chǔ)知識(shí)》速記口訣有哪些2024-11-06
- 2024年中級(jí)經(jīng)濟(jì)師經(jīng)濟(jì)基礎(chǔ)科目考點(diǎn)預(yù)測(cè)(11月6日)2024-11-06
- 考前提分!2024年中級(jí)經(jīng)濟(jì)師必考計(jì)算公式匯總2024-11-05
- 2024年中級(jí)經(jīng)濟(jì)師經(jīng)濟(jì)基礎(chǔ)科目考點(diǎn)預(yù)測(cè)(11月5日)2024-11-05
- 2024年中級(jí)經(jīng)濟(jì)師經(jīng)濟(jì)基礎(chǔ)科目考點(diǎn)預(yù)測(cè)(11月4日)2024-11-04
- 快速提分!2024年中級(jí)經(jīng)濟(jì)師考前沖刺資料合集免費(fèi)下載了2024-11-01
- 2024年中級(jí)經(jīng)濟(jì)師考前資料包都有哪些?2024-11-01
- 2024年中級(jí)經(jīng)濟(jì)師經(jīng)濟(jì)基礎(chǔ)科目考點(diǎn)預(yù)測(cè)匯總2024-11-01
- 2024年中級(jí)經(jīng)濟(jì)師經(jīng)濟(jì)基礎(chǔ)科目考點(diǎn)預(yù)測(cè)(10月31日)2024-10-31
- 2024年中級(jí)經(jīng)濟(jì)師經(jīng)濟(jì)基礎(chǔ)科目考點(diǎn)預(yù)測(cè)(10月30日)2024-10-30