求職意向
數(shù)據(jù)分析 北京 薪資面議 隨時到崗
教育背景
2020.x -2020x 錘子簡歷大學(xué) 統(tǒng)計學(xué)--碩士
在此期間,學(xué)習(xí)統(tǒng)計相關(guān)基礎(chǔ)理論與高級理論,抽樣算法,EM算法,貝葉斯估計,時間序列分析,回歸假設(shè)等課程。
2020.x -2020x 錘子簡歷大學(xué) 數(shù)學(xué)與應(yīng)用數(shù)學(xué)--本科
主要學(xué)習(xí)數(shù)學(xué)相關(guān)各個基礎(chǔ)課程,數(shù)學(xué)分析,幾何,離散,統(tǒng)計,泛函分析,拓?fù)涞日n程,在校擔(dān)任年級學(xué)習(xí)委員,年級文藝委員,開展互幫互助學(xué)習(xí)小組并承擔(dān)大四畢 業(yè)晚會策劃與節(jié)目選擇,同時多次策劃黨員實踐活動。
2020.x -2020x 錘子簡歷大學(xué) 數(shù)學(xué)--交換生
在校期間,主要學(xué)習(xí)微分方程,偏微分方程,拓?fù)鋵W(xué)等,學(xué)習(xí)成績優(yōu)異,積極參加各種志愿者活動,以及參加博士的研討會學(xué)習(xí)專業(yè)知識。
工作經(jīng)驗
2020.x -2020x
項目經(jīng)驗
2020.x -2020x 智能文本審核 隊長
·項目背景
上海銀行第二屆金融科技類創(chuàng)新比賽,本屆大賽以“智慧金融 普惠金融”為主題,倡導(dǎo)青年人才關(guān)注并思考未來發(fā)展,運用創(chuàng)新理念和前瞻技術(shù),打造具有廣泛社會價值和產(chǎn)業(yè)價值的金融產(chǎn)品和服務(wù)。
·項目成果
榮獲上海地區(qū)二等獎以及港澳臺三地總決賽的季軍。
·項目職責(zé)
用python開發(fā)主要算法實現(xiàn)各個功能模塊,JavaScript搭建前端網(wǎng)頁,最終實現(xiàn)了合同的名稱,供應(yīng)商名稱,金額大小寫,支付條件,條款等的快速審核。幫助把人們從繁瑣的工作解脫出來。
實習(xí)經(jīng)驗
2020.x -2020x 錘子簡歷信息技術(shù)有限公司 智能決策部--數(shù)據(jù)挖掘工程師
1.文本挖掘類工作
(1)
算法實現(xiàn)。
負(fù)責(zé)利用大數(shù)據(jù)平臺,pyspark處理大量文本類數(shù)據(jù),進行分詞,新詞識別,命名體識別,提取信息,文本相似度的算法編寫,涉及研讀kdd工業(yè)論文以及一些學(xué)術(shù)論文,理解HMM,CRF等基本算法。
(2)
數(shù)據(jù)挖掘。
負(fù)責(zé)小區(qū)名識別,從短信提取各類信息,語音文本雙錄,新聞輿情預(yù)測,pboc大規(guī)模地址匹配等算法開發(fā)以及優(yōu)化,主要涉及LR,樸素貝葉斯,textcnn,fasttext等文本分類算法以及相似度匹配,主要為業(yè)務(wù)做決策提供數(shù)據(jù)支撐。
(3)
變量加工。
用算法提取后的信息,加工變量,用逾期表現(xiàn)以及計算IV,KS值來評估變量效果。
2.異常檢測類工作
(1)
套現(xiàn)行為檢測。
利用neo4j將交易階段關(guān)聯(lián)的ip,gps,設(shè)備號等信息構(gòu)建為知識圖譜,通過挖掘圖譜的一度二度關(guān)系,圖的密度,進行套現(xiàn)賬戶識別。嘗試?yán)胓raph embedding的方式進行圖結(jié)構(gòu)的轉(zhuǎn)換,再進行異常檢測。
(2)
模型監(jiān)控。
對模型的入模參數(shù)到模型性能,最后到模型結(jié)果進行全面監(jiān)控告警,負(fù)責(zé)auc,psi,ks指標(biāo)值的開發(fā),用pyspark寫一些K-SIGMA,BOXPLOT等機器學(xué)習(xí)的異常監(jiān)測算法通過同比,環(huán)比幫助監(jiān)控模型的這些指標(biāo)。
(3)
渠道監(jiān)控。
實時監(jiān)控公司不同產(chǎn)品渠道下的申請單量和通過率,并發(fā)出告警。
(4)
實時監(jiān)控。
開發(fā)發(fā)送實時報表,接收Kafka消息,在spark-streaming進行消費統(tǒng)計,實時發(fā)送郵件報表
3.算法工具開發(fā)工作
(1)
自動化決策工具。
將線下審批根據(jù)逾期表現(xiàn),審批通過率等多項指標(biāo)的最優(yōu)決策的人工過程進行算法工程化,實現(xiàn)這一過程從2-3周的迭代更新時間縮短為了分鐘級別,極大提高了公司及時調(diào)整策略的效率。
(2)
外部數(shù)據(jù)源評估工具。
包含周期,分箱方式(等寬,等頻,自定義,決策樹,卡方等),產(chǎn)品維度,逾期維度等多方面的可配置化工具,最終輸出評估數(shù)據(jù)源質(zhì)量的各個指標(biāo)。
2020.x -2020x 錘子簡歷信息技術(shù)有限公司 信息技術(shù)中心--實習(xí)生
1.負(fù)責(zé)風(fēng)險控制的智能文本解析項目
調(diào)研各個公司有關(guān)自然語言處理,文本挖掘的產(chǎn)品,聯(lián)系公司進行交流學(xué)習(xí),安排poc時間。用python合作開發(fā)自動審核文件項目產(chǎn)品。
2.負(fù)責(zé)發(fā)現(xiàn)證券賬戶協(xié)同操作項目
根據(jù)賬戶的交易行為,建立行為特征向量,計算相似度,利用時間周期,來發(fā)現(xiàn)協(xié)同操作的賬戶。主要涉及K均值,層次聚類,fpgrowth等關(guān)聯(lián)規(guī)則算法。用scala寫算法,處理數(shù)據(jù),得到結(jié)果。
自我評價
本人性格活潑開朗,有良好的溝通能力,責(zé)任心強事業(yè)心強,有不服輸和吃苦耐勞的精神,學(xué)習(xí)能力強,喜歡接觸新生事物
內(nèi)容來源說明:本文章來自網(wǎng)絡(luò)收集,如侵犯了你的權(quán)益,請聯(lián)系QQ:2772182309進行刪除。
http://www.90xin.cn/article/315858.html