申请
算法总监(T9/M3-1)
姓名: W先生 顾问面试: 擅长领域: 领域 职位: 算法总监(T9/M3-1) 最高学历: 博士 香港大学 沟通情况: 新鲜出炉
面议 目前住址:   求职区域: 考虑公司类型: 不限 考虑公司行业: 不限 接受工作强度: 不限
个人情况: 1991出生   男   未婚 候选人优势:
工作经验
京东 在职时间: 2021-8 至今 职位: 算法总监(T9/M3-1) 下属人数: 40 工作职责: 负责 NLP、推荐、搜索、营销等多个算法团队,以及大模型在营销、金融领域的应用探索。 大模型 LLM 算法方向:主要包括 LLM 在智能问答、智能营销、财富助手等场景的应用。 大模型微调: 应用 DeepSpeed 框架、LoRA、全参数微调等方案对开源大模型进行领域微调,应用于智能问答、营销、财富等业务。 智能问答:DocQA 结合 vicuna-13b,优化京小智(智能机器人)回复效果,在不影响回复准确率的情况下,提升回复覆盖率 2%。 智能营销助手: 优化 DST 信息抽取任务,方案为 Schema Driven Prompting 结合 vicuna、ziya、baichuan 等大模型,同时应用 tool learning 优化时间、数值类信息识别准确度。在投放策略、权益、任务、费用等多个营销系统中达到识别准确率 avg-acc 95%+、joint-acc 85%+。 智能财富助手: 共实现 5 个常用功能。其中,智能筛选功能,算法方案为基于 Roberta-large 的多任务 NL2SQL 模型,准确率对标同花顺-问财。此外,应用 LLM as Controller 范式,实现智能投教问答、产品对比、行情咨询、持仓陪伴等功能。 NLP 算法方向:主要业务场景包括金融领域通用预训练语言模型、内容理解、内容配品等。 金融领域智能问答: 京小智对话机器人,金融领域(包括理财、消金、借贷、保险等业务)任务型对话服务,应用于 APP 内及私域流量用户运营,回复覆盖率 75%+、回复准确率 97%+、用户平均回复时间缩短 70% 以上。 内容挂品: 主要在内容推荐场景,短视频、图文等内容关联上理财、信贷、电商等产品以提升业务导流,优化 CTR 提升 100% 以上。 行业多标签模型: WoBert+ + 多标签 BPR 损失函数优化 + FGM 对抗学习;实体抽取模型:WoBert+ + CRF。用于从内容中识别出候选物品。 相似度排序模型: WoBert+ + HAN。对候选物品和内容进行相似度排序。 搜索算法方向:主要业务场景包括 APP 综合搜索、垂类业务搜素等。 应用 SimCSE、coSENT 等算法优化 Query-Doc 匹配,提升搜索体验及业务转化 10% 以上。 应用 PET、P-tuning、instance-wise P-tuning 等 Prompt Learning 方案优化 few-shot 意图识别准确率。 在嵌套实体识别场景,使用 GlobalPointer 模型提升整体识别准确率,提升度 2%+。 推荐算法方向:主要业务场景包括短视频、图文等内容推荐,电商推荐,理财产品推荐等。 内容推荐: 主要为短视频、图文等信息流推荐。优化 CTR 提升 20% 以上,人均阅读时长提升10% 以上。在内部算法赛马中整体胜出。 排序环节,结合用户在 APP 场与财经类 sku 交互信息进行跨域兴趣模型,上线 MiNET 模型;多任务模型升级为 xDeepFM+MiNET+PLE 等。 召回环节,u2i 召回 DSSM+FM 融合引入更多交叉信息,i2i 召回升级 Bert-whitening、SimCSE、实时 sku 交互关联内容召回、曝光未点击兴趣衰减等。 电商推荐: 优化 CTR 提升 20% 以上,强消费意愿场景 CTR 超过京东 APP 首页猜你喜欢。 精排环节,DIEN、深度反馈网络、用户疲劳度建模、残差交叉网络等;Debias 建模,PAL、蒸馏 +bias Net 等。 召回环节,LightGCN、SimCSE、Swing、EBR+selection debias+ 升级版负样本纠偏等。 粗排环节,SE net 增强双塔模型 + 蒸馏、MVKE 引入用户向量“千物千面”等。 模型增量更新环节,1.x epoch 优化等。 理财产品推荐: 主要在京东金融 APP 及私域流量场,在具有代表性的债券基金推品项目,曝光人均 GMV 相比运营策略提升了 100% 以上。 排序环节,根据多场景数据分布特性,引入多域 partitioned Norm、HMoE 框架进行跨域建模优化。 样本优化,泛流量场采样 skip-above 方案等。 智能营销算法方向:主要业务场景包括流量分发、优惠券拉新、大促(618、双 11)活动/权益个性化分发等。 流量分发: 建模用户对不同业务线的偏好及转化,提升总体流量价值。采用迁移学习方案进行CTR/CVR 校准,流量价值提升 20% 以上。 优惠券拉新: 电商收银台支付券智能推荐,目标是有限预算下实现高效拉新。主要迭代了one-model、two-model 及 TARnet 等因果推断建模方案,并应用半参数模型建模不同优惠额度的转化率,拉新 ROI 较原策略提升了 20% 以上。 工作业绩: 京东科技 2022 年技术之星奖(全集团共 10 位) 京东绩优员工
腾讯 在职时间: 2020-7 至 2021-8 职位: 算法负责人(11级) 下属人数: 6 工作职责: NLP 算法方向:主要场景包括短视频知识图谱、文本内容理解、爆款歌曲挖掘等。 短视频知识图谱: 构建音乐领域短视频知识图谱,应用 TransD 算法进行图谱向量化,应用于短视频推荐召回及排序环节,提升多样性约 5%。 音乐领域内容理解: 包括歌词理解、评论理解等。使用模型包括 LyricBERT、CommentBERT。其中 LyricBERT 应用到歌曲流派识别中,提升综合识别准确率 1%;CommentBERT 应用于优劣质评论分类、爆款歌曲识别及单曲推荐等场景,其中优劣质评论分类准确率 90% 以上,爆款歌曲识别模型贡献了 20 年下半年 5 首爆款歌曲的发掘。 爆款歌曲挖掘: 基于 LyricBERT、CommentBERT 构建爆款歌曲识别模型,并结合小样本学习方案缓解正样本过少的问题。模型上线后,20 年下半年成功识别出 5 首爆款歌曲,包括《收敛》、《执迷不悟》等。 推荐算法方向:主要场景包括短视频推荐、首页推荐、电台推荐等。 短视频推荐: 提升视频推荐时长约 5%,分发多样性约 5%。 排序环节,上线 MMoE、PLE 等多任务模型,并融合文本、图片、音频等多模态信息及知识图谱信息等。 召回环节,构建领域知识图谱,优化 GraphEmb+i2i 召回等。 APP 首页推荐: 首页存在不同类型的内容推荐模块,包含单曲、短视频、电台、直播、歌单等等,从 0 到 1 建立首页各模块个性化排序系统,提升首页 DAU 约 5%。主要迭代了偏好画像 + 曝光降权、以及 multi-domain HMoE 建模等算法方案。 电台 tab 推荐: 从 0 到 1 建立了长音频内容个性化推荐系统、PUSH 算法等,推动长音频内容个性化推荐渗透率达到 30% 以上,达到歌曲推荐渗透率水平。 召回环节,用户圈层召回、协同召回、以及 DeepWalk、AE-Bert、DSSM、TransD 等模型。 排序环节,xgb、DeepFM、MMoE、PLE 等模型。 PUSH 算法部分,落地了基于 CTR 建模的个性化匹配算法及 Bandit 文案算法,push 点击率整体提升 50%。 工作业绩: 腾讯绩优员工
网易传媒 在职时间: 2019-7 至 2020-7 职位: NLP/推荐算法 下属人数: 2 工作职责: 网易新闻内容理解。 负责网易新闻三俗内容识别项目,提升分发文章质量。推动算法、产品、标注等各团队协作,快速落地并迭代优化,将模型准召由 40%、80% 提升至 80%、90% 以上。模型方面,在基于 CNN的旧模型基础上,陆续尝试并落地了学界前沿的 BERT 模型、全词 Mask 版 Roberta 模型、以及Roberta Small 模型等,并加入了类目 embedding、标签平滑等技术优化。 负责网易新闻负能量内容识别项目,识别并过滤各类负能量新闻,包括暴力血腥、违法犯罪、育儿忌讳等各个方面,初版落地模型为 textCNN。后续应用知识蒸馏方案迭代优化,以 BERT 模型作为 net-T,CNN 网络作为 net-S,提升 CNN 网络识别准确率约 2%。 短视频知识图谱推荐。 爬取电影、电视、综艺、动漫等作品信息以及导演、演员等艺人信息,构建娱乐垂类知识图谱,并应用 transE、transD 等 Graph Embedding 算法进行向量化,在视频推荐召回及精排环节落地,提升用户时长约 2 分钟。
光大集团光子投资 在职时间: 2016-3 至 2019-6 职位: NLP/机器学习算法 工作职责: 基于分析师研报以及新闻等文本数据,应用 Bi-GRU、Hierarchical Attention 等情感分析算法构建统计套利策略模型。基于市场量价、基本面等信息,应用 LSTM、随机森林、xgboost 等算法构建自动交易策略。回测指标 Sharpe 最高达到 3.5,综合实盘年化超额收益率约 10%。
教育/培训经历
香港大学 时间: 2011-9 至 2015-12 博士
中国科技大学少年班 时间: 2007-9 至 2011-7 本科
申请安排面试
X