來源:北大青鳥總部 2019年06月12日 09:57
軟件工程師和系統工程師各位可能不陌生,分析師和產品經理在一些大項目上也會見到,不過大多數情況由軟件工程師客串,系統工程師就是運維人員,保障基礎的硬軟件系統、應用系統穩(wěn)定運行。很多很多的系統就這樣的開發(fā)著、運行著,生產著數據。那么問題來了,生產的數據除了完成業(yè)務所需的基礎功能外,還能不能有其它應用呢?回答是肯定的,能夠發(fā)掘數據、研究數據的人,我們稱之為數據分析師,阿里稱之為數據科學家。
數據分析師需要掌握什么技能呢?他不需要生產數據,也不需要維護數據,要做的是提取數據、分析數據、展現數據。所以數據分析師要有良好的操作數據的技能也就是SQL,分析數據的技能(統計數學基礎,各種BI工具、SPSS軟件等),展現數據的技能(EXCEL的圖表功能)這些,還要會一些靈活好用的編程工具(Delphi,Python),觀察能力和感知力,當然還要有良好的書面和語言表達能力,下面分述。
操縱數據(SQL)
操縱數據而不是操作數據,操縱就是要做到盡可能地控制。如何做到盡可能呢,一般存放在關系型數據庫中,比如兵器譜前三的Oracle、MySQL、SQL Server中,市場保有率高,新增使用量也比較大。那么數據分析師怎么和這些關系型數據庫打交道呢?結構化查詢語言(SQL),這個東西的功能簡單的說就是CRUD(Create, Retrieve, Update, Delete)增查改刪,其它的稱呼是增刪改查,增刪改、查等等。增刪改的操作大多是業(yè)務系統或者數據采集端完成的,數據分析師側重查。要想操縱數據那就要盡量深入、多樣的了解數據庫產品。一般意義上的數據抽取后再研究的模式在數據量大、數據安全等因素影響下,已越來越不現實。掌握主流數據庫的查詢技能是獲取所需數據的根本性手段。
分析數據的技能
這里主要是指以統計學為主的數學方法,說的太多都是理論,介紹幾本書。
1)《統計學習方法(第二版)》作者李航,男,畢業(yè)于日本京都大學電氣電子工程系,日本東京大學獲得計算機科學博士學位。北京大學、南京大學兼職教授。曾任日本NEC公司中央研究所研究員,微軟亞洲研究院高級研究員與主任研究員、華為技術有限公司諾亞方舟實驗室主任。現任今日頭條人工智能實驗室主任。就沖著頭條大腦這一條就該讀這本書:
2)《統計學》大學教材SPSS軟件版,這個是本科統計學的教材,作者團隊的另一本書《統計學(第7版)》是教育部和國家統計局推薦的統計學教材,不過我推薦的是使用SPSS實踐版本的教材,兩種技能都學了。
3)《統計學(第六版)》[美] 威廉·M.門登霍爾(William M.Mendenhall)著,關靜 等譯,統計學的權威教材,有精力的可以學習:
有了上面的著作作為理論基礎和實踐指導,接下來就需要軟件來配合實踐了。工欲善其事必先利其器,這里推薦IBM公司的SPSS軟件和微軟的Excel,Excel這個工具大家經常使用,不過從Excel2013后加入的PowerQuery大家不一定熟悉,這里推薦閱讀微軟的官方文檔,以及和PowerQuery有緊密關系的PowerBI,都是統計分析的優(yōu)秀工具,重點說說IBM SPSS軟件,這是統計業(yè)內的最知名的軟件,行業(yè)內廣泛使用。
編程工具
數據分析師需要編程嗎?特定情況下需要的。數據分析師的編程主要是為了更好的呈現數據和整理數據,比如有些動態(tài)的呈現數據的要求,通過選擇選項實時展示分析結果,這樣的要求使用專用的分析工具太繁瑣,這時候就需要將數據封裝在展示軟件內。再者就是有些數據的處理比較麻煩,SQL語句解決不了,這時候也要借助編程工具來達到目的。推薦的展示工具是Delphi,整理、獲取數據的工具是Delphi和Python。
觀察能力和感知力
這個是最為重要的能力,數據所展現出來的100個人眼中有100個哈姆雷特,角度不同數據的魅力也不同,這就要求數據分析師有良好的觀察能力和感知力,能夠從業(yè)務、用戶的表達入手,去探討、解析數據,讓分析結果盡快而又高效展現出來。
書面和語言表達能力
這個能力就是要讓數據分析活起來,書面和語言是活起來的最直接有效的手段,用戶理解接受了分析結果也就使數據分析有了生命力。
以上是數據分析師的一些剪影描述,各種大潮一浪又一浪地迎面而來,數據分析師是潮水退后留在沙灘上的珍珠,在潮水中歷練成珍。
版權說明:本文來源網絡,如有侵權請聯系小編進行刪除!