2019-07-16 15:31:06 來源:互聯(lián)網(wǎng)
干垃圾or濕垃圾
你學(xué)會分類了嗎?
最近,上海的垃圾分類新聞成為了全國熱議的話題。先別急著笑,因?yàn)槔诸悓纳虾M崎_到全國46個城市試點(diǎn),而且已經(jīng)提上日程,所以如何做好垃圾分類,是我們每個人都要做的功課。
而說到了垃圾分類,小編就想到了數(shù)據(jù)分類,其實(shí)兩者何等的相似。曾經(jīng)認(rèn)為,數(shù)據(jù)只要安安靜靜地躺在磁盤里就好了,但隨著對數(shù)據(jù)的認(rèn)識越來越深刻,人們發(fā)現(xiàn)數(shù)據(jù)其實(shí)是一座閃閃發(fā)光的金礦。
而隨著AI、IoT的向前發(fā)展,數(shù)據(jù)的價值還在不斷上升,已經(jīng)成為企業(yè)最寶貴的資產(chǎn)。
從無人問津到視若珍寶,這種轉(zhuǎn)變,真是有種恍若隔世的感覺。不過,如果沒有正確地將數(shù)據(jù)因材施用,那么數(shù)據(jù)價值也無法真正實(shí)現(xiàn),如同錯誤地把干垃圾放進(jìn)濕垃圾桶里一樣。
所以,對IT人來說,學(xué)會數(shù)據(jù)如何分類,同樣重要!
?
下面小編就出幾
道題來考考各位
01
辦公文檔、文本、XML等各類報表應(yīng)該歸類為結(jié)構(gòu)化數(shù)據(jù)還是非結(jié)構(gòu)化數(shù)據(jù)?
A. 結(jié)構(gòu)化數(shù)據(jù)。
C.非結(jié)構(gòu)化數(shù)據(jù)。
B. 兩者都不是。
D.兩者都是。
答案
C
解析:有些人誤以為只有圖像、影音之類的文件才是非結(jié)構(gòu)化數(shù)據(jù),其實(shí)凡是不適用于數(shù)據(jù)庫二維表來表現(xiàn)的都是非結(jié)構(gòu)化數(shù)據(jù),這包括所有格式的辦公文檔、XML、HTML、各類報表、圖片和咅頻、視頻信息等。
02
在結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)之間,還有半結(jié)構(gòu)化數(shù)據(jù),以下對半結(jié)構(gòu)化數(shù)據(jù)表述是正確的是?(多選)
A. 介于結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)之間。
B. 一種適用于數(shù)據(jù)庫集成的數(shù)據(jù)模型。
C. 半結(jié)構(gòu)化數(shù)據(jù)的構(gòu)成更為復(fù)雜和不確定,從而也具有更高的靈活性,能夠適應(yīng)更為廣泛的應(yīng)用需求。
D. 既是結(jié)構(gòu)化數(shù)據(jù),也是非結(jié)構(gòu)化數(shù)據(jù)。
答案
ABC
解析:半結(jié)構(gòu)化數(shù)據(jù)是介于完全結(jié)構(gòu)化數(shù)據(jù)和完全無結(jié)構(gòu)的數(shù)據(jù)之間的數(shù)據(jù)。半結(jié)構(gòu)化數(shù)據(jù)是結(jié)構(gòu)化數(shù)據(jù)的一種形式,它并不符合關(guān)系型數(shù)據(jù)庫或其他數(shù)據(jù)表的形式關(guān)聯(lián)起來的數(shù)據(jù)模型結(jié)構(gòu),但包含相關(guān)標(biāo)記,用來分隔語義元素以及對記錄和字段進(jìn)行分層。因此,它也被稱為自描述的結(jié)構(gòu)。
03
A.一個
C.三個
B.兩個
D.四個
答案
C
解析:一個證明存在性,一個證明唯一性,第三個推導(dǎo)出一種非構(gòu)建算法來實(shí)現(xiàn)他。
04
什么是熱數(shù)據(jù)?
A.溫度高于40度的數(shù)據(jù)。
B.指機(jī)房通風(fēng)不暢,吹不到空調(diào)的磁盤里的數(shù)據(jù)。
C.指需要被計算節(jié)點(diǎn)頻繁訪問的數(shù)據(jù)。
D. 是指溫度高于60度的數(shù)據(jù)。
答案
C
解析:這就不需要解釋了吧
05
冷數(shù)據(jù)和熱數(shù)據(jù)如何進(jìn)行有效利用?
A.冷數(shù)據(jù)遠(yuǎn)離空調(diào),熱數(shù)據(jù)就近空調(diào)。
B.冷數(shù)據(jù)就近空調(diào),熱數(shù)據(jù)遠(yuǎn)離空調(diào)。
C.冷數(shù)據(jù)就近計算,熱數(shù)據(jù)集中存儲。
D. 冷數(shù)據(jù)集中存儲,熱數(shù)據(jù)就近計算。
答案
D
解析:由于熱數(shù)據(jù)是需要被計算節(jié)點(diǎn)頻繁訪問的在線類數(shù)據(jù),因此需要就近計算,而冷數(shù)據(jù)冷數(shù)據(jù)訪問頻次低,效率要求慢,可以做集中化部署。
06
什么是流數(shù)據(jù)?
A. 會流動的數(shù)據(jù)。
B. 是一組順序、大量、快速、連續(xù)到達(dá)的數(shù)據(jù)序列。
C. 在短時間內(nèi)被大量讀取或?qū)懭氲臄?shù)據(jù)。
D. 一種名為流數(shù)據(jù)的液體。
答案
B
解析:關(guān)于流數(shù)據(jù),可以看我們戴爾易安信中國研發(fā)中心的專家所寫的文章。
07
按照粒度來劃分,數(shù)據(jù)分為以下哪幾個類別?
A. 明細(xì)數(shù)據(jù)、狀態(tài)數(shù)據(jù)。
B. 匯總數(shù)據(jù)、原始數(shù)據(jù)。
C.明細(xì)數(shù)據(jù)、匯總數(shù)據(jù)。
D.匯總數(shù)據(jù)、衍生數(shù)據(jù)。
答案
C
解析:所謂數(shù)據(jù)粒度,指的是數(shù)據(jù)倉庫中數(shù)據(jù)單元的細(xì)節(jié)程度或綜合程度的級別。這種分類方式的相關(guān)場景有兩種,一種是在數(shù)據(jù)倉庫設(shè)計時,如何對數(shù)據(jù)進(jìn)行匯總,按什么方式進(jìn)行匯總,才能達(dá)到使用效率和匯總成本的平衡。另一種是數(shù)據(jù)分析人員在分析數(shù)據(jù)時,在明細(xì)數(shù)據(jù)、各種匯總數(shù)據(jù)之間選擇合適的數(shù)據(jù),以提高分析效率。
08
A.按照字段類型劃分。
B.按照描述事物的角度劃分。
C. 按照數(shù)據(jù)粒度劃分。
D. 按照數(shù)據(jù)結(jié)構(gòu)劃分。
答案
A
解析:按照字段類型分類數(shù)據(jù)的是最基本的數(shù)據(jù)分類方式。
09
從描述事物的角度,數(shù)據(jù)有哪幾個分類?
A. 狀態(tài)類數(shù)據(jù)、事件類數(shù)據(jù)、混合類數(shù)據(jù)。
B. 事件類數(shù)據(jù)、匯總類數(shù)據(jù)、時間類數(shù)據(jù)。
C. 事件類數(shù)據(jù)、混合類數(shù)據(jù)、明細(xì)類數(shù)據(jù)。
D. 狀態(tài)類數(shù)據(jù)、衍生類數(shù)據(jù)、混合類數(shù)據(jù)。
答案
A
解析:這種分類方式在數(shù)據(jù)倉庫建模是特別重要。數(shù)據(jù)倉庫需要保存各種歷史數(shù)據(jù),不同類型的歷史數(shù)據(jù)保存方式差別很大。狀態(tài)類數(shù)據(jù)保存歷史的方式一般有兩種:存儲快照或者SCD方式。事件類數(shù)據(jù)一旦發(fā)生就已經(jīng)是歷史了,只需直接存儲或者按時間分區(qū)存儲?;旌项悢?shù)據(jù)保存歷史比較復(fù)雜,可以把變化的字段分離出來,按狀態(tài)類數(shù)據(jù)保存,剩下不變的則按事件類數(shù)據(jù)保存,使用時再把兩者合并。
10
數(shù)據(jù)湖和數(shù)據(jù)倉庫的區(qū)別?(多選)
A. 數(shù)據(jù)湖比數(shù)據(jù)倉庫能存儲更多數(shù)據(jù)。
B. 數(shù)據(jù)湖是存儲大量原始數(shù)據(jù),數(shù)據(jù)倉庫是存儲清洗加工過的,可信任的、結(jié)構(gòu)良好的數(shù)據(jù)。
C. 傳統(tǒng)數(shù)據(jù)倉庫工作方式是集中式的,數(shù)據(jù)湖是開放式、自定義的。
D.數(shù)據(jù)倉庫存儲之前需要定義schema,數(shù)據(jù)湖是之后才需要定義。
答案
BCD
解析:數(shù)據(jù)湖建設(shè)思路從本質(zhì)上顛覆了傳統(tǒng)數(shù)據(jù)倉庫建設(shè)方法論。傳統(tǒng)的企業(yè)數(shù)據(jù)倉庫則強(qiáng)調(diào)的是整合、面向主題、分層次等思路。其兩者并不是對等的概念,更多是包含;即數(shù)據(jù)倉庫作為數(shù)據(jù)湖的一類數(shù)據(jù)應(yīng)用存在。
11
D記有一款處理非結(jié)構(gòu)化數(shù)據(jù)的當(dāng)紅炸子雞,它是?
A. Unity XT
C.Isilon
B. XtremIO
D. SC Series
答案
C
解析:Dell EMC Isilon是業(yè)界排名第一的橫向擴(kuò)展NAS存儲平臺,專用于存儲、管理和保護(hù)海量非結(jié)構(gòu)化數(shù)據(jù),同時大幅降低成本和復(fù)雜性。
12
滅霸響指一打,地球上的人口瞬間少了一半,請問滅霸適合當(dāng)什么職業(yè)?
A.數(shù)據(jù)挖掘師
C.算法工程師
B.數(shù)據(jù)分析師
D.存儲管理員
答案
C
13
A. John R. Mashey于1998年發(fā)表的《大數(shù)據(jù)與下一代基礎(chǔ)架構(gòu)壓力》論文中最早提出。
B. 國際咨詢機(jī)構(gòu)麥肯錫于2011年發(fā)布的《大數(shù)據(jù):下一個創(chuàng)新、競爭和生產(chǎn)力的前沿》研究報告中最早提出大數(shù)據(jù)概念。
C. Doug Laney在2001發(fā)表的《3D數(shù)據(jù)管理:控制數(shù)據(jù)數(shù)量、速度及種類》研究報告中最早提出了大數(shù)據(jù)概念。
D. 1987年,一個名為JohnP.Nelson的人在comp.sources.misc新聞組發(fā)布了一串代碼,其中有這樣一段說明:#不管怎樣,它使用的是一個緊湊模型(小代碼,大數(shù)據(jù)),最早提出了大數(shù)據(jù)概念。
答案
A
解析:John R. Mashey最早提出了今天意義上的大數(shù)據(jù),而比他更早提出的大數(shù)據(jù)概念,指的并不是今天意義上的大數(shù)據(jù)。
14
小明是搞數(shù)據(jù)分析的,已經(jīng)學(xué)會了如何從DW中用SQL對數(shù)據(jù)ETL并建立Cube。目前想要找出今年2月份公司營業(yè)收入遠(yuǎn)遠(yuǎn)小于其它月份的原因,但至今未果,為什么?Ps.使用過spss、sas中的數(shù)據(jù)挖掘模型。
A.小明技術(shù)不到家
C.今年二月只有28天
B.小明用錯數(shù)據(jù)模型
D.二月是春節(jié)
答案
D
14道題,答對幾個了?
最后來一則廣告
現(xiàn)在購買普通中端存儲
即可1:1免費(fèi)置換全閃存
更有多品類產(chǎn)品鉅惠出擊
買戴爾易安信存儲和服務(wù)器
買普通存儲,免費(fèi)升級全閃,不加價!
獲取您的服務(wù)器專屬底價!
長按二維碼立享存儲優(yōu)惠!