求職意向
數(shù)據(jù)倉(cāng)庫(kù) 北京 薪資面議 隨時(shí)到崗
教育背景
2020.x -2020x 錘子簡(jiǎn)歷大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)
主要學(xué)習(xí)內(nèi)容為數(shù)據(jù)結(jié)構(gòu)、算法、
C語(yǔ)言、
Java
工作經(jīng)驗(yàn)
2020.x -2020x 隨行付 數(shù)據(jù)倉(cāng)庫(kù)工程師、數(shù)據(jù)分析師、組負(fù)責(zé)人
- 基于Hive的數(shù)據(jù)倉(cāng)庫(kù)由 0 到 1 的設(shè)計(jì)與實(shí)現(xiàn)
- 基于Azkaban,Sqoop的數(shù)據(jù)抽取以及數(shù)倉(cāng)調(diào)度配置
- 依托SmartBi的報(bào)表以及自主分析功能的實(shí)現(xiàn)
- 了解用戶端開發(fā)邏輯,實(shí)現(xiàn)全公司迎接檢查系統(tǒng)的數(shù)據(jù)清洗
- 基于隨機(jī)森林算法,通過(guò)Python的Sklearn庫(kù),對(duì)客戶進(jìn)行簡(jiǎn)單流失預(yù)測(cè)
- 對(duì)接業(yè)務(wù)需求,協(xié)助管理
2020.x -2020x 便利蜂-未來(lái)購(gòu) 數(shù)據(jù)分析師
- 對(duì)接商品部各MD,對(duì)上新以及促銷商品進(jìn)行銷售分析,指導(dǎo)運(yùn)營(yíng)
- 對(duì)接市場(chǎng)部運(yùn)營(yíng)人員,分析各類檔期活動(dòng)情況,對(duì)不同類型活動(dòng)給出銷售建議
- 接手咖啡項(xiàng)目,將咖啡的銷量由單店單天20杯提升至45杯,其中天津門店滲 透率達(dá)到10%
- 完成包括市場(chǎng)部、集裝箱便利店、共享打印機(jī)、共享充電寶等項(xiàng)目的日常數(shù)據(jù)提取以及報(bào)表開發(fā)工作
2020.x -2020x 錘子簡(jiǎn)歷信息技術(shù)有限公司 數(shù)據(jù)開發(fā)工程師
- 數(shù)據(jù)倉(cāng)庫(kù)的開發(fā)和維護(hù):ETL以及數(shù)據(jù)模型設(shè)計(jì)
- 數(shù)據(jù)報(bào)表的需求分析和開發(fā)
- 核心切換中的數(shù)據(jù)遷移部分
項(xiàng)目經(jīng)驗(yàn)
2020.x -2020x 隨行付-協(xié)助檢查數(shù)據(jù)包裝 負(fù)責(zé)人
- 與用戶,審單組深入合作,梳理其系統(tǒng)前端顯示內(nèi)容與數(shù)據(jù)庫(kù)表的映射關(guān)系以及邏輯加工規(guī)則
- 根據(jù)數(shù)據(jù)校驗(yàn)規(guī)則,對(duì)全公司客戶數(shù)據(jù)做統(tǒng)一數(shù)據(jù)清洗以及校正;將數(shù)據(jù)由生產(chǎn)庫(kù)同步至檢查數(shù)據(jù)庫(kù),用以應(yīng)對(duì)合規(guī)檢查;共涉及51張表
2020.x -2020x 隨行付-數(shù)據(jù)倉(cāng)庫(kù)擴(kuò)展建設(shè) 提供設(shè)計(jì)和方案,工作由整體團(tuán)隊(duì)完成
- SmartBi+Impala+Oracle+Rpt 的方式,實(shí)現(xiàn)報(bào)表查詢;SmartBi+Impala+Dws+Rpt 的方式,實(shí)現(xiàn)自主分析(自主提數(shù))
- 實(shí)現(xiàn)系統(tǒng)之間數(shù)據(jù)推送或者調(diào)用:比如標(biāo)簽等大規(guī)模計(jì)算數(shù)據(jù)推送回業(yè)務(wù)系統(tǒng);生成特征變量數(shù)據(jù),協(xié)助風(fēng)控系統(tǒng)做涉黑預(yù)測(cè);提供Impala查詢接口,解決業(yè)務(wù)系統(tǒng)歷史數(shù)據(jù)查詢問(wèn)題
- 結(jié)合業(yè)務(wù)需求,探索機(jī)器學(xué)習(xí)模型的實(shí)際應(yīng)用;通過(guò)分析用戶留存時(shí)間,首刷時(shí)間,二刷時(shí)間的間隔分布,確定模型預(yù)測(cè)周期為14天,90天;通過(guò)Hive+Python(隨機(jī)森林)的方式,對(duì)個(gè)人用戶的流失做出預(yù)測(cè);準(zhǔn)確率 75%,覆蓋率 78%
- 與UI同事配合,采用Oralce+Echart的方式,完成隨行付業(yè)務(wù)數(shù)據(jù)大屏的開發(fā)
2020.x -2020x 隨行付-數(shù)據(jù)倉(cāng)庫(kù)基礎(chǔ)建設(shè) 負(fù)責(zé)人
- 基于數(shù)據(jù)調(diào)研工作,確認(rèn)數(shù)倉(cāng)分層:SRC-> ODS-> DWD-> DWS-> RPT;前3層為明細(xì)層,采用自下而上的建模方式,生成維度事實(shí)矩陣;后2層為匯總層、報(bào)表層,通過(guò)自上而下的建模方式,根據(jù)業(yè)務(wù)場(chǎng)景建立匯總表,以及退化部分維度
- 確認(rèn)業(yè)務(wù)系統(tǒng)到數(shù)倉(cāng)的數(shù)據(jù)同步方式(離線Kettle+實(shí)時(shí)Kafka)+Sqoop,制作離線同步配置表,配合開發(fā)完成離線任務(wù)的配置化上線工作;并通過(guò)Azkaban實(shí)現(xiàn)各任務(wù)之間的依賴調(diào)度
- 為避免人為數(shù)據(jù)變更、Kafka消費(fèi)問(wèn)題導(dǎo)致的數(shù)據(jù)不準(zhǔn)確,通過(guò)Python+Sql對(duì)關(guān)鍵表實(shí)現(xiàn)數(shù)據(jù)監(jiān)控;記錄數(shù)據(jù)從業(yè)務(wù)系統(tǒng)到數(shù)倉(cāng)各層的數(shù)據(jù)量,并對(duì)異常進(jìn)行郵件報(bào)警
- 完成95%的DW層邏輯模型、物理模型的設(shè)計(jì);50%的模型開發(fā);100%的前期模型上線復(fù)核
2020.x -2020x 隨行付-數(shù)據(jù)調(diào)研-建立數(shù)倉(cāng)準(zhǔn)備工作 負(fù)責(zé)人
- 為數(shù)倉(cāng)建設(shè)做準(zhǔn)備,共梳理 260 張數(shù)據(jù)中心使用到以及可能會(huì)使用到的表;明確表結(jié)構(gòu)、各表關(guān)聯(lián)關(guān)系、數(shù)據(jù)質(zhì)量問(wèn)題等
- 歷時(shí) 1 個(gè)半月,與 7 個(gè)生產(chǎn)系統(tǒng)負(fù)責(zé)人溝通后,鎖定 238 張可用表;基于此制作出ER圖
2020.x -2020x 便利蜂-咖啡項(xiàng)目 數(shù)據(jù)分析師
1.在人貨場(chǎng)三個(gè)不同的角度,分析歷史上所有的咖啡活動(dòng),并根據(jù)當(dāng)前最主要的目標(biāo):提升PSD,提出了買一送一活動(dòng),該活動(dòng)將PSD由20杯提升至45杯,平均每日新客戶數(shù)量是原來(lái)的4倍,但是毛利只下降20%
2.使用4周購(gòu)買頻率將客戶分群,并通過(guò)AB測(cè)試,研究各類客戶群體對(duì)不同折扣的優(yōu)惠券的敏感程度,該分析正在進(jìn)行中
2020.x -2020x 便利蜂-商品部報(bào)表遷移以及優(yōu)化 負(fù)責(zé)人
- 確定業(yè)務(wù)口徑,如價(jià)格構(gòu)成、成本組成等,保證各報(bào)表數(shù)據(jù)的一致性;之后該口徑作為整個(gè)商品部,市場(chǎng)部統(tǒng)一數(shù)據(jù)輸出規(guī)范
- 梳理所有商品部報(bào)表(總計(jì)200左右),將原來(lái)由Python執(zhí)行的報(bào)表程序改為Sql執(zhí)行并配置至郵件系統(tǒng)
- 整合內(nèi)容相同或者類似報(bào)表,并且優(yōu)化執(zhí)行時(shí)間過(guò)長(zhǎng)的Sql
2020.x -2020x 哈爾濱銀行數(shù)據(jù)遷移 開發(fā)以及流程梳理
- 分析新老系統(tǒng)的不同,通過(guò)存儲(chǔ)過(guò)程實(shí)現(xiàn)單支程序,Xshell實(shí)現(xiàn)程序調(diào)用以及特殊處理,Use調(diào)度工具實(shí)現(xiàn)總體流程
- 優(yōu)化關(guān)鍵路徑上面程序,縮短單支程序執(zhí)行時(shí)間:
- 查看存儲(chǔ)過(guò)程詳細(xì)執(zhí)行計(jì)劃,根據(jù)執(zhí)行計(jì)劃對(duì)過(guò)大的數(shù)據(jù)進(jìn)行分區(qū)或者增加Hint
- 更改Sql的寫法,將執(zhí)行時(shí)間過(guò)長(zhǎng)、各表關(guān)聯(lián)混亂的Sql,先執(zhí)行篩選條件,并配合臨時(shí)表的方式,將單支程序從1小時(shí)優(yōu)化至3分鐘
- 梳理每個(gè)任務(wù)之間的依賴,進(jìn)一步分解單個(gè)任務(wù),保證任務(wù)之間的并發(fā)執(zhí)行,整體時(shí)間從8小時(shí)優(yōu)化至3.5小時(shí)
2020.x -2020x 哈爾濱銀行新數(shù)據(jù)平臺(tái) 數(shù)據(jù)模型設(shè)計(jì)
- 負(fù)責(zé)部分源系統(tǒng)到ODS層的ETL工作,多數(shù)采用Oracle存儲(chǔ)過(guò)程,少部分采用Informatica
- 設(shè)計(jì)EDW數(shù)據(jù)模型,通過(guò)存儲(chǔ)過(guò)程將源數(shù)據(jù)分不同主題寫入EDW,通過(guò)碼值加工以及關(guān)系的轉(zhuǎn)換,盡可能規(guī)避源系統(tǒng)數(shù)據(jù)變化對(duì)集市層模型的影響
自我評(píng)價(jià)
1
.性格隨和,可以較快融入陌生環(huán)境,不抗拒短時(shí)間高強(qiáng)度加班
2.敢于接受挑戰(zhàn),學(xué)習(xí)能力較強(qiáng),一周內(nèi)可以初步使用陌生語(yǔ)言進(jìn)行開發(fā)
3.思路清理,遇到問(wèn)題可以理性分析,權(quán)衡解決
內(nèi)容來(lái)源說(shuō)明:本文章來(lái)自網(wǎng)絡(luò)收集,如侵犯了你的權(quán)益,請(qǐng)聯(lián)系QQ:2772182309進(jìn)行刪除。
http://www.90xin.cn/article/316022.html