算法工程師簡(jiǎn)歷范文
求職意向
算法工程師 湖南長(zhǎng)沙 薪資面議 隨時(shí)到崗
教育背景
2020.x -2020x 錘子簡(jiǎn)歷大學(xué) 地球信息科學(xué)與技術(shù)
相關(guān)課程:線(xiàn)性代數(shù)、微積分、概率論與統(tǒng)計(jì)、復(fù)變函數(shù)與積分變換、數(shù)理方程、計(jì)算機(jī)基礎(chǔ)、
微機(jī)原理與匯編語(yǔ)言、C++程序設(shè)計(jì)、MATLAB程序設(shè)計(jì)、數(shù)字信號(hào)處理、地球信息數(shù)據(jù)處理與反演等
2020.x -2020x 錘子簡(jiǎn)歷大學(xué) 地球探測(cè)與信息技術(shù)
相關(guān)課程:數(shù)值分析、計(jì)算地球物理、地震資料數(shù)字處理、地球物理反演等
自學(xué)課程:Machine Learning (Andrew Ng)、自然語(yǔ)言處理綜論 (馮志偉)、統(tǒng)計(jì)學(xué)習(xí)方法 (李航)、統(tǒng)計(jì)自然語(yǔ)言處理基礎(chǔ) (苑春法)、統(tǒng)計(jì)自然語(yǔ)言處理 (宗成慶)、Python自然語(yǔ)言處理等
工作經(jīng)驗(yàn)
2020.x -2020x 錘子簡(jiǎn)歷信息技術(shù)有限公司 算法工程師
- 負(fù)責(zé)開(kāi)發(fā)文本相關(guān)的算法,維護(hù)數(shù)據(jù)質(zhì)量,為科研數(shù)據(jù)平臺(tái)建設(shè)和產(chǎn)品服務(wù)提供基礎(chǔ)
- 參與開(kāi)發(fā)智匯云科研數(shù)據(jù)檢索和分析功能
2020.x -2020x 錘子簡(jiǎn)歷信息技術(shù)有限公司 物探數(shù)據(jù)工程師
- 對(duì)野外采集的彈性波數(shù)據(jù)進(jìn)行信號(hào)處理、圖像處理、反演(信息預(yù)測(cè))等,重現(xiàn)地下三維空間
- 跟進(jìn)學(xué)習(xí)行業(yè)前沿新算法,應(yīng)用于實(shí)際生產(chǎn)項(xiàng)目
項(xiàng)目經(jīng)驗(yàn)
2020.x -2020x 智匯云-科技論文數(shù)據(jù)服務(wù)類(lèi)產(chǎn)品 負(fù)責(zé)算法研發(fā)
項(xiàng)目描述:開(kāi)發(fā)科技論文數(shù)據(jù)去重、標(biāo)注、檢索排序算法,建立科研數(shù)據(jù)檢索和分析服務(wù)平臺(tái)
1. 數(shù)據(jù)去重算法
獨(dú)立完成開(kāi)發(fā)
- 方法: 提取作者、標(biāo)題、關(guān)鍵詞和摘要文本,經(jīng)過(guò)分詞、TF-IDF加權(quán)、hash計(jì)算、合并和降維處理,將文本轉(zhuǎn)換為SimHash代碼,通過(guò)Hamming distance計(jì)算文本相似度, 去除不同采集來(lái)源的重復(fù)數(shù)據(jù)
- 效果: 計(jì)算效率26秒/100萬(wàn)條,較原字符級(jí)別算法(0.8秒/100萬(wàn)條)提高32倍,準(zhǔn)確率94%
2. 機(jī)構(gòu)標(biāo)注算法
獨(dú)立完成開(kāi)發(fā)
- 方法: 分詞、詞形還原預(yù)處理,提取特征項(xiàng)(學(xué)校名、院系名、作者、地址、郵編),統(tǒng)計(jì)各學(xué)校詞典,剔除無(wú)用高頻詞和停用詞,使用詞袋模型向量化各特征項(xiàng),基于樸素貝葉斯方法對(duì)期刊數(shù)據(jù)標(biāo)注學(xué)校ID
- 效果: 在人工維護(hù)詞表基礎(chǔ)上,統(tǒng)計(jì)出更多的匹配模式(如英文簡(jiǎn)寫(xiě)、別名、學(xué)校合并前的名稱(chēng)等),大幅提高了機(jī)構(gòu)標(biāo)注效率和數(shù)據(jù)量
3. 學(xué)者標(biāo)注算法
獨(dú)立完成開(kāi)發(fā)
- 方法: 歸類(lèi)同姓名學(xué)者,基于ElasticSearch引擎快速提取同名侯選集,以同姓名、同學(xué)校、同院系的數(shù)據(jù)為正樣本,使用邏輯回歸訓(xùn)練模型,對(duì)期刊數(shù)據(jù)標(biāo)注到學(xué)者ID
- 效果: 結(jié)合搜索引擎和邏輯回歸算法,大幅提高運(yùn)算效率
4. 檢索排序算法
參與開(kāi)發(fā)中
- 方法: 從搜索引擎的大量日志中挖掘用戶(hù)點(diǎn)擊行為, 構(gòu)建用戶(hù)畫(huà)像,基于Listwise算法排序,為用戶(hù)返回個(gè)性化的檢索排序列表
2020.x -2020x 天津石油學(xué)會(huì)創(chuàng)新創(chuàng)效 - 巖相自動(dòng)識(shí)別技術(shù) 負(fù)責(zé)算法研發(fā)、項(xiàng)目匯報(bào)
- 目標(biāo):通過(guò)彈性波測(cè)量得到的地下速度、密度信息,預(yù)測(cè)地下巖石類(lèi)型
- 方法:建立從巖石類(lèi)型至速度、密度的數(shù)學(xué)模型關(guān)系,以鉆井區(qū)域的速度、密度和巖石類(lèi)型為訓(xùn)練數(shù)據(jù),通過(guò)貝葉斯判別算法預(yù)測(cè)未鉆井區(qū)域的巖石類(lèi)型。同時(shí)引入馬爾克夫鏈模型,使巖相預(yù)測(cè)結(jié)果在深度方向連續(xù)變化,并且排除了不合理的預(yù)測(cè)結(jié)果
- 效果:較傳統(tǒng)的色標(biāo)融合方法,該技術(shù)的識(shí)別效率及準(zhǔn)確率得到顯著提升, 后期鉆井證實(shí)預(yù)測(cè)準(zhǔn)確率84%,獲得天津石油學(xué)會(huì)優(yōu)秀科技成果一等獎(jiǎng)
自我評(píng)價(jià)
- 理解機(jī)器學(xué)習(xí)的基礎(chǔ)理論(降維、回歸、分類(lèi)、聚類(lèi)、推薦等),熟悉求解算法及參數(shù)調(diào)優(yōu)
- 理解深度學(xué)習(xí)原理和基本模型(CNN/RNN),熟悉 Tensorflow 深度學(xué)習(xí)框架
- 熟悉Spark分布式計(jì)算平臺(tái),熟悉ElasticSearch分布式檢索服務(wù)器
- 掌握J(rèn)ava/Matlab/Python語(yǔ)言,有較強(qiáng)的算法分析和實(shí)現(xiàn)能力
- 學(xué)習(xí)能力強(qiáng),能快速閱讀中英文文獻(xiàn),較好的語(yǔ)言、書(shū)面表達(dá)和溝通能力
內(nèi)容來(lái)源說(shuō)明:本文章來(lái)自網(wǎng)絡(luò)收集,如侵犯了你的權(quán)益,請(qǐng)聯(lián)系QQ:2772182309進(jìn)行刪除。
http://www.90xin.cn/article/296171.html