算法总监（T9/M3-1）

姓名: W先生 顾问面试: 擅长领域: 领域职位: 算法总监（T9/M3-1） 最高学历: 博士香港大学 沟通情况: 新鲜出炉

面议 目前住址: 求职区域: 考虑公司类型: 不限 考虑公司行业: 不限 接受工作强度: 不限

个人情况: 1991出生男未婚 候选人优势:

工作经验

京东 在职时间: 2021-8 至今职位: 算法总监（T9/M3-1） 下属人数: 40 工作职责: 负责 NLP、推荐、搜索、营销等多个算法团队，以及大模型在营销、金融领域的应用探索。大模型 LLM 算法方向：主要包括 LLM 在智能问答、智能营销、财富助手等场景的应用。大模型微调: 应用 DeepSpeed 框架、LoRA、全参数微调等方案对开源大模型进行领域微调，应用于智能问答、营销、财富等业务。智能问答:DocQA 结合 vicuna-13b，优化京小智（智能机器人）回复效果，在不影响回复准确率的情况下，提升回复覆盖率 2%。智能营销助手: 优化 DST 信息抽取任务，方案为 Schema Driven Prompting 结合 vicuna、ziya、baichuan 等大模型，同时应用 tool learning 优化时间、数值类信息识别准确度。在投放策略、权益、任务、费用等多个营销系统中达到识别准确率 avg-acc 95%+、joint-acc 85%+。智能财富助手: 共实现 5 个常用功能。其中，智能筛选功能，算法方案为基于 Roberta-large 的多任务 NL2SQL 模型，准确率对标同花顺-问财。此外，应用 LLM as Controller 范式，实现智能投教问答、产品对比、行情咨询、持仓陪伴等功能。 NLP 算法方向：主要业务场景包括金融领域通用预训练语言模型、内容理解、内容配品等。金融领域智能问答: 京小智对话机器人，金融领域（包括理财、消金、借贷、保险等业务）任务型对话服务，应用于 APP 内及私域流量用户运营，回复覆盖率 75%+、回复准确率 97%+、用户平均回复时间缩短 70% 以上。内容挂品: 主要在内容推荐场景，短视频、图文等内容关联上理财、信贷、电商等产品以提升业务导流，优化 CTR 提升 100% 以上。行业多标签模型: WoBert+ + 多标签 BPR 损失函数优化 + FGM 对抗学习；实体抽取模型:WoBert+ + CRF。用于从内容中识别出候选物品。相似度排序模型: WoBert+ + HAN。对候选物品和内容进行相似度排序。搜索算法方向：主要业务场景包括 APP 综合搜索、垂类业务搜素等。应用 SimCSE、coSENT 等算法优化 Query-Doc 匹配，提升搜索体验及业务转化 10% 以上。应用 PET、P-tuning、instance-wise P-tuning 等 Prompt Learning 方案优化 few-shot 意图识别准确率。在嵌套实体识别场景，使用 GlobalPointer 模型提升整体识别准确率，提升度 2%+。推荐算法方向：主要业务场景包括短视频、图文等内容推荐，电商推荐，理财产品推荐等。内容推荐: 主要为短视频、图文等信息流推荐。优化 CTR 提升 20% 以上，人均阅读时长提升10% 以上。在内部算法赛马中整体胜出。排序环节，结合用户在 APP 场与财经类 sku 交互信息进行跨域兴趣模型，上线 MiNET 模型；多任务模型升级为 xDeepFM+MiNET+PLE 等。召回环节，u2i 召回 DSSM+FM 融合引入更多交叉信息，i2i 召回升级 Bert-whitening、SimCSE、实时 sku 交互关联内容召回、曝光未点击兴趣衰减等。电商推荐: 优化 CTR 提升 20% 以上，强消费意愿场景 CTR 超过京东 APP 首页猜你喜欢。精排环节，DIEN、深度反馈网络、用户疲劳度建模、残差交叉网络等；Debias 建模，PAL、蒸馏 +bias Net 等。召回环节，LightGCN、SimCSE、Swing、EBR+selection debias+ 升级版负样本纠偏等。粗排环节，SE net 增强双塔模型 + 蒸馏、MVKE 引入用户向量“千物千面”等。模型增量更新环节，1.x epoch 优化等。理财产品推荐: 主要在京东金融 APP 及私域流量场，在具有代表性的债券基金推品项目，曝光人均 GMV 相比运营策略提升了 100% 以上。排序环节，根据多场景数据分布特性，引入多域 partitioned Norm、HMoE 框架进行跨域建模优化。样本优化，泛流量场采样 skip-above 方案等。智能营销算法方向：主要业务场景包括流量分发、优惠券拉新、大促（618、双 11）活动/权益个性化分发等。流量分发: 建模用户对不同业务线的偏好及转化，提升总体流量价值。采用迁移学习方案进行CTR/CVR 校准，流量价值提升 20% 以上。优惠券拉新: 电商收银台支付券智能推荐，目标是有限预算下实现高效拉新。主要迭代了one-model、two-model 及 TARnet 等因果推断建模方案，并应用半参数模型建模不同优惠额度的转化率，拉新 ROI 较原策略提升了 20% 以上。 工作业绩: 京东科技 2022 年技术之星奖（全集团共 10 位）京东绩优员工

腾讯 在职时间: 2020-7 至 2021-8 职位: 算法负责人（11级） 下属人数: 6 工作职责: NLP 算法方向：主要场景包括短视频知识图谱、文本内容理解、爆款歌曲挖掘等。短视频知识图谱: 构建音乐领域短视频知识图谱，应用 TransD 算法进行图谱向量化，应用于短视频推荐召回及排序环节，提升多样性约 5%。音乐领域内容理解: 包括歌词理解、评论理解等。使用模型包括 LyricBERT、CommentBERT。其中 LyricBERT 应用到歌曲流派识别中，提升综合识别准确率 1%；CommentBERT 应用于优劣质评论分类、爆款歌曲识别及单曲推荐等场景，其中优劣质评论分类准确率 90% 以上，爆款歌曲识别模型贡献了 20 年下半年 5 首爆款歌曲的发掘。爆款歌曲挖掘: 基于 LyricBERT、CommentBERT 构建爆款歌曲识别模型，并结合小样本学习方案缓解正样本过少的问题。模型上线后，20 年下半年成功识别出 5 首爆款歌曲，包括《收敛》、《执迷不悟》等。推荐算法方向：主要场景包括短视频推荐、首页推荐、电台推荐等。短视频推荐: 提升视频推荐时长约 5%，分发多样性约 5%。排序环节，上线 MMoE、PLE 等多任务模型，并融合文本、图片、音频等多模态信息及知识图谱信息等。召回环节，构建领域知识图谱，优化 GraphEmb+i2i 召回等。 APP 首页推荐: 首页存在不同类型的内容推荐模块，包含单曲、短视频、电台、直播、歌单等等，从 0 到 1 建立首页各模块个性化排序系统，提升首页 DAU 约 5%。主要迭代了偏好画像 + 曝光降权、以及 multi-domain HMoE 建模等算法方案。电台 tab 推荐: 从 0 到 1 建立了长音频内容个性化推荐系统、PUSH 算法等，推动长音频内容个性化推荐渗透率达到 30% 以上，达到歌曲推荐渗透率水平。召回环节，用户圈层召回、协同召回、以及 DeepWalk、AE-Bert、DSSM、TransD 等模型。排序环节，xgb、DeepFM、MMoE、PLE 等模型。 PUSH 算法部分，落地了基于 CTR 建模的个性化匹配算法及 Bandit 文案算法，push 点击率整体提升 50%。 工作业绩: 腾讯绩优员工

网易传媒 在职时间: 2019-7 至 2020-7 职位: NLP/推荐算法 下属人数: 2 工作职责: 网易新闻内容理解。负责网易新闻三俗内容识别项目，提升分发文章质量。推动算法、产品、标注等各团队协作，快速落地并迭代优化，将模型准召由 40%、80% 提升至 80%、90% 以上。模型方面，在基于 CNN的旧模型基础上，陆续尝试并落地了学界前沿的 BERT 模型、全词 Mask 版 Roberta 模型、以及Roberta Small 模型等，并加入了类目 embedding、标签平滑等技术优化。负责网易新闻负能量内容识别项目，识别并过滤各类负能量新闻，包括暴力血腥、违法犯罪、育儿忌讳等各个方面，初版落地模型为 textCNN。后续应用知识蒸馏方案迭代优化，以 BERT 模型作为 net-T，CNN 网络作为 net-S，提升 CNN 网络识别准确率约 2%。短视频知识图谱推荐。爬取电影、电视、综艺、动漫等作品信息以及导演、演员等艺人信息，构建娱乐垂类知识图谱，并应用 transE、transD 等 Graph Embedding 算法进行向量化，在视频推荐召回及精排环节落地，提升用户时长约 2 分钟。

光大集团光子投资 在职时间: 2016-3 至 2019-6 职位: NLP/机器学习算法 工作职责: 基于分析师研报以及新闻等文本数据，应用 Bi-GRU、Hierarchical Attention 等情感分析算法构建统计套利策略模型。基于市场量价、基本面等信息，应用 LSTM、随机森林、xgboost 等算法构建自动交易策略。回测指标 Sharpe 最高达到 3.5，综合实盘年化超额收益率约 10%。

教育/培训经历

香港大学 时间: 2011-9 至 2015-12 博士

中国科技大学少年班 时间: 2007-9 至 2011-7 本科