如何用深度神经网络预测潜在消费者


1. 模型架构

本项目采用的是DeepFM模型,其结构结合了FM(因子分解机)与深度神经网络(DNN),实现了低阶与高阶特征交互的有效建模。模型分为以下几层:

1.1 FM部分(因子分解机层)

FM层主要用于建模稀疏特征的低阶交互,其数学公式如下:

  • 一阶部分(线性模型):
  • y linear = ∑ i = 1 n w i x i y_{\text{linear}} = \sum_{i=1}^{n} w_i x_i ylinear=i=1nwixi
  • 其中,wi是线性权重,xi是输入特征。
  • 二阶部分(特征交互部分):
  • y FM = ∑ i = 1 n ∑ j = i + 1 n ⟨ v i , v j ⟩ x i x j y_{\text{FM}} = \sum_{i=1}^{n} \sum_{j=i+1}^{n} \langle \mathbf{v}_i, \mathbf{v}_j \rangle x_i x_j yFM=i=1nj=i+1nvi,vjxixj
  • 其中,vi 和 vj 是特征嵌入向量,表示特征间的隐式交互,⟨vi,vj⟩ 是向量的内积,用于捕捉特征之间的低阶关系。
1.2 DNN部分(深度神经网络层)

DNN部分用于捕捉高阶特征交互。输入特征首先通过嵌入层映射为低维稠密向量,然后输入深度神经网络。DNN部分的计算公式如下:

  • 第一层全连接层
  • h 1 = ReLU ( W 1 ⋅ x + b 1 ) h_1 = \text{ReLU}(W_1 \cdot x + b_1) h1=ReLU(W1x+b1)
  • 其中,W1和 b1 是第一层的权重矩阵和偏置,x是输入的嵌入向量,ReLU是激活函数。
  • 第二层全连接层
  • h 2 = ReLU ( W 2 ⋅ h 1 + b 2 ) h_2 = \text{ReLU}(W_2 \cdot h_1 + b_2) h2=ReLU(W2h1+b2)
  • 类似地,W2和 b2 是第二层的权重矩阵和偏置。
  • 输出层
  • y DNN = σ ( W 3 ⋅ h 2 + b 3 ) y_{\text{DNN}} = \sigma(W_3 \cdot h_2 + b_3) yDNN=σ(W3h2+b3)
  • 其中,σ是sigmoid激活函数,用于二分类预测。
1.3 DeepFM的融合

DeepFM模型将FM部分和DNN部分的输出进行融合,最终的输出为:

y output = σ ( y linear + y FM + y DNN ) y_{\text{output}} = \sigma(y_{\text{linear}} + y_{\text{FM}} + y_{\text{DNN}}) youtput=σ(ylinear+yFM+yDNN)

通过同时训练这三部分,模型能够同时捕捉到低阶和高阶特征交互。
在这里插入图片描述

2.1 训练流程

模型的训练流程包括以下步骤:

  • 数据准备:对输入特征进行嵌入,并将稀疏特征转化为低维嵌入向量,同时将连续特征归一化。
  • 前向传播:通过FM层和DNN层分别对低阶和高阶特征进行建模,并将两部分的结果结合起来,计算最终输出。
  • 损失函数:使用二元交叉熵损失函数:
  • L = − 1 N ∑ i = 1 N [ y i log ⁡ ( y i ^ ) + ( 1 − y i ) log ⁡ ( 1 − y i ^ ) ] L = -\frac{1}{N} \sum_{i=1}^{N} \left[ y_i \log(\hat{y_i}) + (1 - y_i) \log(1 - \hat{y_i}) \right] L=N1i=1N[yilog(yi^)+(1yi)log(1yi^)]
  • 其中,yi是真实标签,yi^是模型预测的概率。
  • 优化器:模型使用Adam优化器来更新参数,调整学习率以获得最佳收敛效果。
2.2 评估指标
  • AUC(Area Under Curve) :AUC用于评估模型的分类能力。AUC值越接近1,表示模型的分类性能越好。模型通过回调函数监控验证集上的AUC,以确定模型性能并进行早停或调整学习率。

3. 核心代码详细讲解

1. 数据预处理与特征工程

解释:读取用户行为数据集,包含用户与商品的交互数据。

暂时无法在飞书文档外展示此内容

解释:随机生成一个1到5之间的整数来替换原始的 action_type 列。这里模拟了不同的用户行为类型,可能为了确保数据的多样性或处理数据的平衡性。

暂时无法在飞书文档外展示此内容

解释:将行为时间字段转换为datetime格式,并按照时间排序,以便后续提取时序特征并进行模型训练。

暂时无法在飞书文档外展示此内容

解释:从行为时间中提取月、日等时序特征,以帮助模型捕捉用户行为的时间趋势。

2. 模型架构构建

解释:定义DeepFM模型的输入部分。sparse_input用于处理类别型(稀疏)特征,dense_input用于处理连续型(密集)特征。

暂时无法在飞书文档外展示此内容

解释:对稀疏特征进行嵌入处理。每个类别型特征通过嵌入层转换为低维的稠密向量,便于后续的FM和DNN层处理。

暂时无法在飞书文档外展示此内容

解释:构建FM模型的一阶线性部分,将稀疏和密集特征的线性嵌入结果结合,形成线性组合。

暂时无法在飞书文档外展示此内容

解释:构建FM部分的二阶交互层,计算嵌入向量的内积并通过 Subtract 操作实现特征交互。通过平方和差公式得到交互结果,并通过Lambda层调整系数。

暂时无法在飞书文档外展示此内容

解释:DNN部分通过多个全连接层实现高阶特征的非线性组合。每一层都通过批标准化、激活函数和Dropout层进行处理,防止过拟合并增强模型的泛化能力。

暂时无法在飞书文档外展示此内容

解释:将FM模型的线性部分、二阶交互部分以及DNN部分的输出拼接在一起,最终通过Sigmoid层输出预测结果(适用于二分类任务)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/887165.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

深入探究:在双链表指定元素的后面进行插入操作的顺序

归纳编程学习的感悟, 记录奋斗路上的点滴, 希望能帮到一样刻苦的你! 如有不足欢迎指正! 共同学习交流! 🌎欢迎各位→点赞 👍 收藏⭐ 留言​📝惟有主动付出,才有丰富的果…

Win10系统插入带有麦克风的耳机_麦克风不起作用_解决方法_亲测成功---Windows运维工作笔记054

今天我在使用讯飞输入法的时候,想通过讯飞的语音输入法来提高自己的输入效率。 但是这个时候发现一个问题就是我插入我的台式机的是一个带有麦克风的耳机。 但是发现我这个耳机没有办法被电脑识别出麦克风来,所以说就没办法使用讯飞输入法的语音输入功能来直接输入文字了。…

【重学 MySQL】五十六、位类型

【重学 MySQL】五十六、位类型 定义赋值与使用注意事项应用场景 在MySQL数据库中,位类型(BIT类型)是一种用于存储位字段值的数据类型。 定义 BIT(n)表示n个位字段值,其中n是一个范围从1到64的整数。这意味着你可以存储从1位到64…

华为GaussDB数据库之Yukon安装与使用

一、Yukon简介 Yukon(禹贡),基于openGauss、PostgreSQL、GaussDB数据库扩展地理空间数据的存储和管理能力,提供专业的GIS(Geographic Information System)功能,赋能传统关系型数据库。 Yukon 支…

论文笔记(四十七)Diffusion Policy: Visuomotor Policy

Diffusion Policy: Visuomotor Policy 文章概括摘要1. 介绍2. 扩散策略的公式化2.1 去噪扩散概率模型2.2 DDPM 训练2.3 用于视觉运动策略学习的扩散模型 3 关键设计决策3.1 网络架构选项3.2 视觉编码器3.3 噪声计划3.4 加速实时控制的推理 4. 扩散策略的四个引人入胜的特性4.1 …

回归预测 | Matlab基于SABO-SVR减法平均算法优化支持向量机的数据多输入单输出回归预测

回归预测 | Matlab基于SABO-SVR减法平均算法优化支持向量机的数据多输入单输出回归预测 目录 回归预测 | Matlab基于SABO-SVR减法平均算法优化支持向量机的数据多输入单输出回归预测预测效果基本描述程序设计参考资料 预测效果 基本描述 1.Matlab基于SABO-SVR减法平均算法优化…

【api连接ChatGPT的最简单方式】

通过api连接ChatGPT的最简单方式 建立client 其中base_url为代理,若连接官网可省略;配置环境变量 from openai import OpenAI client OpenAI(base_url"https://api.chatanywhere.tech/v1" )或给出api和base_url client OpenAI(api_key&…

数据仓库简介(一)

数据仓库概述 1. 什么是数据仓库? 数据仓库(Data Warehouse,简称 DW)是由 Bill Inmon 于 1990 年提出的一种用于数据分析和挖掘的系统。它的主要目标是通过分析和挖掘数据,为不同层级的决策提供支持,构成…

wordpress源码资源站整站打包32GB数据,含6.7W条资源数据

源码太大了,足足32gb,先分享给大家。新手建立资源站,直接用这个代码部署一下,数据就够用了。辅助简单做下seo,一个新站就OK了。 温馨提示:必须按照顺序安装 代码下载

【word脚注】双栏设置word脚注,脚注仅位于左栏,右栏不留白

【word脚注】双栏设置word脚注,脚注仅位于左栏,右栏不留白 调整前效果解决方法调整后效果参考文献 调整前效果 调整前:脚注位于左下角,但右栏与左栏内容对其,未填充右下角的空白区域 解决方法 备份源文件复制脚注内…

【HTML|第1期】HTML5视频(Video)元素详解:从起源到应用

日期:2024年9月9日 作者:Commas 签名:(ง •_•)ง 积跬步以致千里,积小流以成江海…… 注释:如果您觉在这里插入代码片得有所帮助,帮忙点个赞,也可以关注我,我们一起成长;如果有不对…

【机器学习】探索GRU:深度学习中门控循环单元的魅力

目录 🍔 GRU介绍 🍔 GRU的内部结构图 2.1 GRU结构分析 2.2 GRU工作原理 2.4 Bi-GRU介绍 2.3 使用Pytorch构建GRU模型 2.5 GRU优缺点 🍔 小结 学习目标 🍀 了解GRU内部结构及计算公式. 🍀 掌握Pytorch中GRU工具…

MySQL--数据库约束(详解)

目录 一、前言二、概念三、数据库约束3.1 约束类型3.1.1 NOT NULL 约束3.1.2 UNIQUE (唯一)3.1.3 DEFAULT(默认)3.1.4 PRIMARY KEY(主键)3.1.5 FOREIGN KEY(外键)3.1.6 CHECK 四、总结 一、前言…

[Linux#61][UDP] port | netstat | udp缓冲区 | stm32

目录 0. 预备知识 1. 端口号的划分范围 2. 认识知名端口号 3. netstat 命令 4. pidof 命令 二.UDP 0.协议的学习思路 1. UDP 协议报文格式 报头与端口映射: 2. UDP 的特点 面向数据报: 3. UDP 的缓冲区 4. UDP 使用注意事项 5. 基于 UDP 的…

基于Keras的U-Net模型在图像分割与计数中的应用

关于深度实战社区 我们是一个深度学习领域的独立工作室。团队成员有:中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等,曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万粉丝,拥有2篇国家级人工智能发明专利。 社区特色&a…

11. 异步编程

计算机的核心部分,即执行构成我们程序的各个步骤的部分,称为处理器。我们迄今为止看到的程序都会让处理器忙个不停,直到它们完成工作。像操作数字的循环这样的程序的执行速度几乎完全取决于计算机处理器和内存的速度。但是,许多程…

相机基础概念

景深: 景深的定义 DOF:depth of filed 是指在摄影机镜头或其他成像器前沿能够取得清晰图像的成像所测定的被摄物体前后距离范围。光圈、镜头、及焦平面到拍摄物的距离是影响景深的重要因素。定义3:在镜头前方(焦点的前、后)有一…

螺蛳壳里做道场:老破机搭建的私人数据中心---Centos下docker学习02(yum源切换及docker安装配置)

2 前期工作 2.1 切换yum源并更新 删除/etc/yum.repos.d/原有repo文件,将Centos-7.repo库文件拷贝到该目录下。 然后清楚原有缓存yum clean all 生成新的缓存yum makecache 更新yum update –y 然后再确认/etc/yum.repos.d/不会有其他库文件,只留下…

气象大模型天气预测对物流的影响

随着科技的进步,气象大模型(GFM, Global Forecast Model)的广泛应用大大提升了天气预测的精度和时效性。这些模型基于大数据、机器学习、人工智能等技术,能够模拟大气环流,预测未来的天气状况。对于物流行业而言&#…

Pikachu-暴力破解-验证码绕过(on client)

访问页面, 从burpsuite 上看到返回的源代码; 验证码生成时通过 createCode 方法生成,在前端页面生成; 同时也是在前端做的校验; 直接验证;F12 -- 网络,随便输入个账号、密码、验证码&#xff0…