計算機專業(yè)數(shù)據(jù)倉庫見習報告
時間:2022-07-23 02:24:00
導語:計算機專業(yè)數(shù)據(jù)倉庫見習報告一文來源于網(wǎng)友上傳,不代表本站觀點,若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。
一、導讀部分:
可見二者差別之大,這只是數(shù)據(jù)庫與數(shù)據(jù)倉庫的一個概念性的大致區(qū)別。另外它編程人員最關心的建立與操作各方面也差別很大,因此如果你沒有這方面的知識想只憑借數(shù)據(jù)庫發(fā)面的知識來開發(fā)數(shù)據(jù)倉庫的產品是很不可能的這就要求你要從數(shù)據(jù)倉庫最基礎的知識學起。
可能很多同學首先就會想到數(shù)據(jù)庫,說起數(shù)據(jù)倉庫。終究就錯了一個字,但是就是這一個字使這二者差異很大:
即數(shù)據(jù)庫為中心,保守的數(shù)據(jù)庫技術是以單一的數(shù)據(jù)資源。進行事務處理、批處置等各種數(shù)據(jù)處置工作,主要是操作型處理,操作型處置也叫事務處理,指對數(shù)據(jù)庫聯(lián)機的日常操作,通常是對一個或一組紀錄的查詢和修改,主要為企業(yè)的特定應用服務的注重響應時間,數(shù)據(jù)的平安性和完整性。
用以支持經營管理中的決策制定過程,而數(shù)據(jù)倉庫則是面向主題的集成的不可更新的穩(wěn)定性)隨時間不斷變化(不同時間)數(shù)據(jù)集合。主要用于分析型處理(也叫信息型處置)分析型處置則用于管理人員的決策分析,經常要訪問大量的歷史數(shù)據(jù)。
二、數(shù)據(jù)倉庫的基礎知識:
1.數(shù)據(jù)倉庫概念始于上世紀80年代中期,首次出現(xiàn)是在被譽為“數(shù)據(jù)倉庫之父”WilliamH.Inmon的《建立數(shù)據(jù)倉庫》一書中。隨著人們對大型數(shù)據(jù)系統(tǒng)研究、管理、維護等方面的深刻識認和不斷完善,在總結、豐富、集中多行企業(yè)信息的經驗之后,為數(shù)據(jù)倉庫給出了更為精確的定義,即“數(shù)據(jù)倉庫是在企業(yè)管理和決策中面向主題的、集成的、與時間相關的、不可修改的數(shù)據(jù)集合”。數(shù)據(jù)倉庫并沒有嚴格的數(shù)據(jù)理論基礎,也沒有成熟的基本模式,且更偏向于工程,具有強烈的工程性。通常按其關鍵技術部份分為數(shù)據(jù)的抽取、存儲與管理以及數(shù)據(jù)的表現(xiàn)等三個基本方面。
數(shù)據(jù)倉庫的重點與要求是能夠準確、安全、可靠地從數(shù)據(jù)庫中取出數(shù)據(jù),經過加工轉換成有規(guī)律信息之后,再供管理人員進行分析使用。數(shù)據(jù)倉庫主要是應用于決策支持系統(tǒng),其主要目的是“提取”信息并加以擴展,用來進行處理基于數(shù)據(jù)倉庫的決策支持系統(tǒng)(DSS)的應用。
2基于數(shù)據(jù)倉庫的決策支持系統(tǒng)基于數(shù)據(jù)倉庫的決策支持系統(tǒng)(DSS)由三個部件組成:數(shù)據(jù)倉庫技術(Datawarehousing),聯(lián)機分析處理技術(OLAP,On—LineAnalyticalPro—cessing),數(shù)據(jù)挖掘技術(DataMining)。
聯(lián)機分析處理(OLAP,On—AnalyticalPro—cessing)是使分析人員、管理人員或執(zhí)行人員能夠從多種角度對從原始數(shù)據(jù)中轉化出來的、能夠真正為用戶所理解的、并真實反映企業(yè)給特性的信息進行快速、一致、交互地存取,從而獲得對數(shù)據(jù)的更深入了解的一類軟件技術。OLAP的目標是滿足決策支持或多維環(huán)境特定的查詢和報表需求。數(shù)據(jù)倉庫側重于存儲和管理面向決策主題的數(shù)據(jù);而OLAP側重于數(shù)據(jù)倉庫的數(shù)據(jù)分析,并將其轉換成輔助決策信息。OLAP的一個主要特點是多維數(shù)據(jù)分析,這與數(shù)據(jù)倉庫的多維數(shù)據(jù)組織正好形成相互結合、相互補充的關系。問此,利用OLAP技術與數(shù)據(jù)倉庫的結合可以較好地解決傳統(tǒng)決策支持系統(tǒng)既需要處理大量數(shù)據(jù)又需要進行大量數(shù)值計算的問題。
OLAP的多維數(shù)據(jù)分析主要通過對多維數(shù)據(jù)的維進行剖切、鉆取和旋轉來實現(xiàn)對數(shù)據(jù)庫所提供的數(shù)據(jù)進行深入分析,為決策者提供決策支持。多維結構是決策支持的支柱,也是OLAP的核心。
數(shù)據(jù)挖掘(DataMining)是從大量的、不完全的、有噪聲的。模糊的、隨機的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。
數(shù)據(jù)挖掘可以看成是一種數(shù)據(jù)搜尋過程,它不必預先假設或提出問題,但是仍能找到那些非預期的卻令人關注的信息,這些信息表示了數(shù)據(jù)元素的關系和模式。它能挖掘出數(shù)據(jù)鍵潛在的模式(pattern),找出最有價值的信息和知識(knowledge)。指導商業(yè)行為或輔助科學研究。研究對象是大規(guī)模和超大規(guī)模的數(shù)據(jù)集合。
三:在建立數(shù)據(jù)倉庫時應該注意的重點問題:
1.找清楚主題,主題是你的數(shù)據(jù)倉庫研究的一個大方向,如果你把這個都沒有弄清楚的話后面的工作都是白費了。一般數(shù)據(jù)倉庫的主題就是客戶最關心的部分,是客戶的項目做好以后在運行期間時常進行操作和觀察的核心內容。只要你在建立的前真正弄清楚了客戶的需求,一般主題的建立就不會出問題。
2.維度的建設,說白了維度就是客戶的使用分析處理是的一個觀察角度,數(shù)據(jù)倉庫是多維的,也就是用戶在觀察的時候是從多個角度來觀察的。這就要求你在具體的多維數(shù)據(jù)建立前要把用戶的業(yè)務模型建立完備,一般這是一個迭代的過程,在建立好或修改好一個模型后最好和用戶溝通一下,然后根據(jù)用戶的要求再做相應的修改,另外基礎數(shù)據(jù)庫里面的維度表也要同步,把實際用到的維度都能在數(shù)據(jù)庫里有所反應。
3.維度層次的建立:維度層次其實就是用戶在觀察時能夠細化的單位,也可以說是一個范圍,它是用戶在進行切片,上鉆,下鉆時的重要單位,在建立層次的時候首先是要搞清楚要有那些層次,這個通常是用戶要求的,然后在基礎數(shù)據(jù)庫建立的時候一定要把這些層次的順序弄清楚,現(xiàn)在的數(shù)據(jù)倉庫工具大多都是自動對你提供的數(shù)據(jù)表進行搜索而發(fā)現(xiàn)維度層次的,要是的建立基礎數(shù)據(jù)表的時候不注意可能你以后得出的結果就會錯很遠。
四:總結:
1.找實習工作的認識:
我覺得實習其實就是一個從大學生活到工作的一個過度階段,學校和社會差別很大。有很多學生在學校里對自己以后工作的事想的少,準備的少,一旦步入社會自己心里上一片空白,在實習時對于自己到底干什么工作,自己有什么專業(yè)技能也不是很清楚,最后總是過了很久快返校時才找到實習單位。我認為實習很重要,因為實習和正常上班沒有什么兩樣,如果實習時就沒有方向的話,以后工作了想找到方向會走彎路。還有對于大多數(shù)同學來說,先就業(yè),在擇業(yè)是最好的,畢竟自己在學校里接觸社會少,專業(yè)實際操作和運用能力與實際工作要求還是有一定的差距,不要老想著自己一定要找到一份好工作,自己專業(yè)內的工作,自己喜歡的工作,這樣是不切合實際的。
2.工作總結:在日常的工作中也有很多小問題值得我們注意,我總結了一下幾條:
①最好每天都能做工作日記,早上上班前寫好自己在這一天的工作目標,工作中應該注意的重點問題,有哪些事情是要問清楚主管的等。然后在每天的下班前在看一下自己當天做了那些工作,哪些工作目標沒有完成,為什么沒有完成,自己在以后的工作中應該注意哪些問題……,這些將是很重要的,經??纯磿泻艽筮M步。
②在開發(fā)項目的時候最好每天都有一個備份機制,因為電腦出故障是時常發(fā)生的,如果沒有備份的話可能會發(fā)生前功盡棄的可能。
③在開發(fā)時遇到需求說明不是很清楚的地方一定要向上級主管問清楚,因為軟件是做給客戶用的,我們不能憑空想像,那樣開發(fā)出來的東西很有可能會返工。
④在工作中可能會碰到和你的頂頭上司發(fā)生矛盾的事,如果已經發(fā)生了,你要想清楚為什么會發(fā)生這種事,這些事情能不能避免,如果能避免自己在日后的工作中就要多注意一些。
⑤在討論問題時要有自己的見解,不能人云亦云沒有見解。
⑥工作要踏實,認認真真做。
⑦要多總結,多交流。
以上就是我在數(shù)據(jù)倉庫實習期間自己的一些認識和看法,可能還有很多東西自己平時沒有注意到,我也希望,祝愿每一位實習生包括我自己能夠在日后的工作中取得更大進步。
- 上一篇:發(fā)動機拆裝見習報告
- 下一篇:電子電工見習匯報