分享
定制
對(duì)于數(shù)據(jù)挖掘這一技術(shù)領(lǐng)域,一份精心設(shè)計(jì)的簡(jiǎn)歷更是求職者獲得面試機(jī)會(huì)和理想職位的敲門磚,本文是一篇數(shù)據(jù)挖掘領(lǐng)域的求職簡(jiǎn)歷案例,歡迎大家閱讀收藏。
數(shù)據(jù)挖掘求職簡(jiǎn)歷案例參考:
求職意向
求職類型:全職
意向崗位:數(shù)據(jù)挖掘
意向城市:廣東廣州
薪資要求:面議
求職狀態(tài):隨時(shí)到崗
教育背景
時(shí)間:201X.9-201X.7
學(xué)校名稱:錘子簡(jiǎn)歷大學(xué)
專業(yè)名稱:計(jì)算機(jī)科學(xué)與技術(shù)
學(xué)校描述:2017/5 考取軟件設(shè)計(jì)師資格證書
工作經(jīng)歷
時(shí)間:201X.5-至今
公司名稱:錘子簡(jiǎn)歷范文案例
職位名稱:數(shù)據(jù)工程師
1、設(shè)計(jì)和搭建基于數(shù)據(jù)中臺(tái)理念的數(shù)據(jù)架構(gòu),確保數(shù)據(jù)的一致性.可擴(kuò)展性和高可靠性。
2、負(fù)責(zé)數(shù)據(jù)分層架構(gòu)的設(shè)計(jì),將數(shù)據(jù)按照不同的業(yè)務(wù)層次進(jìn)行組織和管理,提升數(shù)據(jù)的可發(fā)現(xiàn)性和可用性。
3、使用Hadoop和Spark技術(shù)棧進(jìn)行大數(shù)據(jù)處理,優(yōu)化數(shù)據(jù)處理流程,減少數(shù)據(jù)處理時(shí)間。
4、設(shè)計(jì)數(shù)據(jù)流程,實(shí)現(xiàn)數(shù)據(jù)的提取.轉(zhuǎn)換和加載(ETL),確保數(shù)據(jù)在不同階段的準(zhǔn)確性和完整性。
5、引入元數(shù)據(jù)管理工具,建立數(shù)據(jù)詞典和數(shù)據(jù)血緣關(guān)系,提升數(shù)據(jù)可追溯性和數(shù)據(jù)治理效率。
6、協(xié)助制定數(shù)據(jù)治理策略,確保數(shù)據(jù)安全性和合規(guī)性,推動(dòng)數(shù)據(jù)隱私保護(hù)措施的落地。
7、與業(yè)務(wù)部門和數(shù)據(jù)科學(xué)團(tuán)隊(duì)緊密合作,理解需求,提供技術(shù)支持,推動(dòng)數(shù)據(jù)驅(qū)動(dòng)決策的實(shí)現(xiàn)。
時(shí)間:201X.10-201X.5
公司名稱:錘子簡(jiǎn)歷范文案例
職位名稱:數(shù)據(jù)工程師
1、負(fù)責(zé)數(shù)倉(cāng)相關(guān)工作,清洗處理數(shù)據(jù)
2、負(fù)責(zé)部分算法相關(guān)項(xiàng)目,包括疾病預(yù)警等
3、協(xié)助運(yùn)營(yíng)相關(guān)工作,開發(fā)部分API接口
時(shí)間:201X.8-201X.10
公司名稱:錘子簡(jiǎn)歷范文案例
職位名稱:數(shù)據(jù)工程師
1、負(fù)責(zé)數(shù)倉(cāng)相關(guān)工作,包括數(shù)據(jù)ETL過程,離線.實(shí)時(shí)數(shù)據(jù)處理,數(shù)據(jù)表結(jié)構(gòu).分區(qū)的設(shè)定等
2、負(fù)責(zé)用戶畫像建模相關(guān)工作
3、負(fù)責(zé)AI預(yù)警模型相關(guān)模型開發(fā)工作
4、參與用戶知識(shí)圖譜挖掘相關(guān)工作
項(xiàng)目經(jīng)驗(yàn)
時(shí)間:201X.5-至今
項(xiàng)目名稱:錘子簡(jiǎn)歷xxx項(xiàng)目案例
項(xiàng)目角色:數(shù)據(jù)開發(fā)
1、分析不同數(shù)據(jù)源的結(jié)構(gòu)和格式,設(shè)計(jì)了有效的數(shù)據(jù)抽取策略,確保從多個(gè)系統(tǒng)中高效地提取數(shù)據(jù)。
2、利用Python編程或Kettle處理工具,開發(fā)了自動(dòng)化的數(shù)據(jù)轉(zhuǎn)換腳本,將數(shù)據(jù)從原始格式轉(zhuǎn)換為適合數(shù)據(jù)倉(cāng)庫(kù)的標(biāo)準(zhǔn)格式。
3、實(shí)施數(shù)據(jù)清洗和質(zhì)量控制,識(shí)別并處理數(shù)據(jù)中的異常值.缺失值等問題,以確保數(shù)據(jù)質(zhì)量。
4、設(shè)計(jì)了數(shù)據(jù)加載流程,將轉(zhuǎn)換后的數(shù)據(jù)加載到數(shù)據(jù)倉(cāng)庫(kù)中,確保數(shù)據(jù)在不同層次的一致性和完整性。
5、針對(duì)大數(shù)據(jù)量的情況,優(yōu)化了數(shù)據(jù)處理算法,提高了處理效率,縮短了數(shù)據(jù)處理時(shí)間。
6、引入任務(wù)調(diào)度工具XXJOB,實(shí)現(xiàn)了自動(dòng)化的ETL流程調(diào)度和監(jiān)控。
時(shí)間:201X.1-至今
項(xiàng)目名稱:錘子簡(jiǎn)歷xxx項(xiàng)目案例
項(xiàng)目角色:數(shù)據(jù)開發(fā)
1、設(shè)計(jì)了數(shù)據(jù)中臺(tái)的整體架構(gòu),包括數(shù)據(jù)湖和數(shù)據(jù)倉(cāng)庫(kù)的結(jié)構(gòu),以滿足不同業(yè)務(wù)需求的數(shù)據(jù)存儲(chǔ)和訪問要求。
2、進(jìn)行數(shù)據(jù)分層,根據(jù)業(yè)務(wù)層次和數(shù)據(jù)類型將數(shù)據(jù)進(jìn)行組織和管理,以提升數(shù)據(jù)的可發(fā)現(xiàn)性和可用性。
3、搭建了基于Hadoop的大數(shù)據(jù)處理平臺(tái),用于數(shù)據(jù)的提取.轉(zhuǎn)換.加載和分析。
4、開發(fā)自動(dòng)化的ETL流程,使用Python或kettle編寫了數(shù)據(jù)轉(zhuǎn)換腳本,確保數(shù)據(jù)從源系統(tǒng)到數(shù)據(jù)中臺(tái)的高效和準(zhǔn)確。
5、與業(yè)務(wù)團(tuán)隊(duì)緊密合作,理解需求,協(xié)助建立數(shù)據(jù)模型,并確保數(shù)據(jù)中臺(tái)能夠滿足不斷變化的業(yè)務(wù)需求。
時(shí)間:201X.11-201X.1
項(xiàng)目名稱:錘子簡(jiǎn)歷xxx項(xiàng)目案例
項(xiàng)目角色:算法開發(fā)
該比賽主要基于醫(yī)療.醫(yī)保數(shù)據(jù)進(jìn)行算法建模,創(chuàng)新改革常州的醫(yī)療。
根據(jù)常州提供的醫(yī)保數(shù)據(jù).醫(yī)療信息以及相關(guān)的患者信息,采用時(shí)間序列模型,預(yù)測(cè)出未2年常州的醫(yī)保開銷,采用logistics算法,預(yù)測(cè)出腦?;颊呶磥硭栝_銷
1、收集和清洗了腦?;颊叩?strong>基本信息.歷史病例等在內(nèi)的多維度信息,為模型訓(xùn)練和評(píng)估提供了豐富的數(shù)據(jù)源。
2、利用Python和機(jī)器學(xué)習(xí)庫(kù),開發(fā)了一個(gè)預(yù)測(cè)模型,采用logistics算法進(jìn)行訓(xùn)練,以預(yù)測(cè)患者未來所需開銷
3、進(jìn)行特征工程,篩選并衍生關(guān)鍵特征,提高了模型的預(yù)測(cè)準(zhǔn)確率和穩(wěn)定性。
4、利用交叉驗(yàn)證和網(wǎng)格搜索等技術(shù),對(duì)模型進(jìn)行了調(diào)優(yōu),以獲得最佳的超參數(shù)配置,并與醫(yī)學(xué)經(jīng)驗(yàn)結(jié)合,驗(yàn)證是否符合邏輯
5、對(duì)訓(xùn)練結(jié)果進(jìn)行截圖,協(xié)助完成報(bào)告編寫.匯報(bào)
時(shí)間:201X.10-201X.3
項(xiàng)目名稱:錘子簡(jiǎn)歷xxx項(xiàng)目案例
項(xiàng)目角色:數(shù)據(jù)開發(fā)
1、收集來自多個(gè)數(shù)據(jù)源的醫(yī)生信息,如醫(yī)生基本信息.資質(zhì)等,為寬表構(gòu)建提供全面的數(shù)據(jù)源。
2、進(jìn)行數(shù)據(jù)預(yù)處理,對(duì)數(shù)據(jù)進(jìn)行清洗.去重和轉(zhuǎn)換,確保數(shù)據(jù)的質(zhì)量和一致性。
3、設(shè)計(jì)寬表的結(jié)構(gòu),根據(jù)業(yè)務(wù)需求和數(shù)據(jù)關(guān)系,將不同數(shù)據(jù)源的信息整合到一個(gè)統(tǒng)一的表結(jié)構(gòu)中。
4、使用SQL和python進(jìn)行數(shù)據(jù)轉(zhuǎn)換,將原始數(shù)據(jù)進(jìn)行拼接.合并和匯總。
5、引入數(shù)據(jù)質(zhì)量控制策略,對(duì)轉(zhuǎn)換后的數(shù)據(jù)進(jìn)行校驗(yàn),確保寬表的準(zhǔn)確性和完整性。
6、為寬表中的數(shù)據(jù)添加索引,提高數(shù)據(jù)查詢性能,以滿足醫(yī)療數(shù)據(jù)分析的需求。
時(shí)間:201X.3-201X.5
項(xiàng)目名稱:錘子簡(jiǎn)歷xxx項(xiàng)目案例
項(xiàng)目角色:算法開發(fā)
根據(jù)瑞金醫(yī)院提供的胰腺癌患者信息,對(duì)術(shù)后是否發(fā)生胰瘺進(jìn)行預(yù)測(cè)。
1、收集了包括患者術(shù)前的基本信息,術(shù)中操作信息以及術(shù)后的檢查信息等多維度醫(yī)療數(shù)據(jù),為預(yù)測(cè)模型提供了豐富的特征。
2、進(jìn)行數(shù)據(jù)清洗和預(yù)處理,處理缺失值和異常值,確保數(shù)據(jù)的準(zhǔn)確性和可用性。
3、使用Python編程,選擇合適的機(jī)器學(xué)習(xí)算法,算法主要采取xgb.lgb.catboost.logistics.randomforest等算法分別建模
4、進(jìn)行交叉驗(yàn)證和超參數(shù)調(diào)優(yōu),以獲得最佳的模型性能和泛化能力。
5、創(chuàng)建了預(yù)測(cè)模型,能夠根據(jù)個(gè)體的醫(yī)療數(shù)據(jù),預(yù)測(cè)其未來一段時(shí)間是否胰瘺的概率。
6、對(duì)模型進(jìn)行了評(píng)估和驗(yàn)證,包括準(zhǔn)確率.召回率.AUC等指標(biāo),以保證模型的有效性和穩(wěn)定性。
7、提供訓(xùn)練結(jié)果截圖.預(yù)測(cè)結(jié)果截圖 ,協(xié)助醫(yī)生完成報(bào)告編寫.匯報(bào)
時(shí)間:201X.5-201X.8
項(xiàng)目名稱:錘子簡(jiǎn)歷xxx項(xiàng)目案例
項(xiàng)目角色:算法開發(fā)
輸入醫(yī)院簡(jiǎn)稱或常用說法,輸出醫(yī)院標(biāo)準(zhǔn)名稱。
難點(diǎn):醫(yī)院名稱中存在個(gè)別字不一樣導(dǎo)致醫(yī)院名稱不一致,較難映射。嘗試了多種算法進(jìn)行映射,包括Levenshtein以及詞向量計(jì)算相似度,效果不好,最后采用提取關(guān)鍵詞進(jìn)行映
時(shí)間:201X.8-201X.10
項(xiàng)目名稱:錘子簡(jiǎn)歷xxx項(xiàng)目案例
項(xiàng)目角色:后端開發(fā)
該項(xiàng)目為計(jì)算患者未來治療所需花費(fèi)。該后端主要采用Django進(jìn)行開發(fā),藥物經(jīng)濟(jì)學(xué)相關(guān)模型主要根據(jù)R語言進(jìn)行開發(fā)。最后采用Docker進(jìn)行部署。
難點(diǎn):主要由于對(duì)R語言不太熟悉,需研究R語言耗費(fèi)時(shí)間。
時(shí)間:201X.10-201X.11
項(xiàng)目名稱:錘子簡(jiǎn)歷xxx項(xiàng)目案例
項(xiàng)目角色:api接口開發(fā)
開發(fā)各種查詢接口,協(xié)助運(yùn)營(yíng)進(jìn)行決策分析。開發(fā)的接口主要包括醫(yī)院名稱地址查詢.醫(yī)院人數(shù)統(tǒng)計(jì)接口.疾病查詢接口.信息提取接口。
信息提取接口主要采用NER算法進(jìn)行識(shí)別。根據(jù)醫(yī)院的醫(yī)囑信息,提取出患者的關(guān)鍵信息。
時(shí)間:201X.1-201X.4
項(xiàng)目名稱:錘子簡(jiǎn)歷xxx項(xiàng)目案例
項(xiàng)目角色:算法開發(fā)
1、收集和清洗了包括個(gè)人信息.財(cái)務(wù)狀況.信用歷史等在內(nèi)的多維度數(shù)據(jù),為模型訓(xùn)練和評(píng)估提供了豐富的數(shù)據(jù)源。
2、利用Python和機(jī)器學(xué)習(xí)庫(kù),開發(fā)了一個(gè)預(yù)測(cè)模型,采用XGBoost算法進(jìn)行訓(xùn)練,以識(shí)別潛在的高風(fēng)險(xiǎn)借款人。
3、進(jìn)行特征工程,篩選并衍生關(guān)鍵特征,提高了模型的預(yù)測(cè)準(zhǔn)確率和穩(wěn)定性。
4、利用交叉驗(yàn)證和網(wǎng)格搜索等技術(shù),對(duì)模型進(jìn)行了調(diào)優(yōu),以獲得最佳的超參數(shù)配置。
5、針對(duì)模型進(jìn)行了全面的評(píng)估和驗(yàn)證,包括準(zhǔn)確率.召回率.ROC曲線等,確保其在不同場(chǎng)景下的穩(wěn)健性。
自我評(píng)價(jià)
1、有很強(qiáng)的學(xué)習(xí)能力.學(xué)習(xí)習(xí)慣和分享精神。
2、具有良好的邏輯思維能力及獨(dú)立思考能力。
3、注重團(tuán)隊(duì)合作,有耐心,責(zé)任心。
專業(yè)技能
1、熟練掌握大數(shù)據(jù)處理平臺(tái),如Hadoop.Spark和Flink等,能夠有效地處理和分析大規(guī)模數(shù)據(jù)。
2、熟悉關(guān)系型數(shù)據(jù)庫(kù)(如MySQL.PostgreSQL)和NoSQL數(shù)據(jù)庫(kù)(如Hive.HBase),能夠進(jìn)行數(shù)據(jù)建模.查詢優(yōu)化和性能調(diào)優(yōu)。
3、具備數(shù)據(jù)倉(cāng)庫(kù)架構(gòu)設(shè)計(jì)的能力,了解維度建模和星型/雪花模型,能夠設(shè)計(jì)適合業(yè)務(wù)需求的數(shù)據(jù)結(jié)構(gòu)。
4、熟悉ETL(抽取.轉(zhuǎn)換.加載)流程,能夠使用工具(如kettle)或編程語言(如Python)實(shí)現(xiàn)數(shù)據(jù)的清洗.轉(zhuǎn)換和加載。
5、理解數(shù)據(jù)分層的概念,能夠?qū)?shù)據(jù)按照業(yè)務(wù)需求進(jìn)行合理的分層和組織,提高數(shù)據(jù)可發(fā)現(xiàn)性和可用性。
6、熟悉數(shù)據(jù)質(zhì)量控制方法,能夠建立數(shù)據(jù)質(zhì)量規(guī)則.監(jiān)控和清洗策略,推動(dòng)數(shù)據(jù)治理流程。
7、能夠分析問題.追蹤根因,并提供有效的解決方案,確保數(shù)據(jù)流程的穩(wěn)定性和數(shù)據(jù)質(zhì)量。
文/錘子簡(jiǎn)歷
精美簡(jiǎn)歷模板,來自錘子簡(jiǎn)歷:www.90xin.cn
錘子簡(jiǎn)歷(100chui.com),專業(yè)簡(jiǎn)歷制作
著作權(quán)歸作者所有,轉(zhuǎn)載請(qǐng)聯(lián)系作者獲得授權(quán)。
【使用錘子簡(jiǎn)歷小程序制作簡(jiǎn)歷】
零經(jīng)驗(yàn)實(shí)習(xí)簡(jiǎn)歷模板
21254人用過
學(xué)生求職簡(jiǎn)歷模板
52754人用過
申請(qǐng)研究生簡(jiǎn)歷模板
2324人用過
經(jīng)典工作簡(jiǎn)歷模板
6254人用過
投行咨詢簡(jiǎn)歷模板
12465人用過
產(chǎn)品經(jīng)理簡(jiǎn)歷模板
7532人用過
程序員簡(jiǎn)歷模板
7457人用過
留學(xué)英文簡(jiǎn)歷模板
4554人用過