ὒ; 这两年开始毕业设计和毕业答辩的要求和难度不断提升,传统的毕设题目缺少创新和亮点,往往达不到毕业答辩的要求,这两年不断有学弟学妹告诉学长自己做的项目系统达不到老师的要求。
为了大家能够顺利以及最少的精力通过毕设,学长分享优质毕业设计项目,今天要分享的是
Ὢ; 基于大数据的京东消费行为分析与可视化
ᾔ;学长这里给一个题目综合评分(每项满分5分)
难度系数:3分工作量:3分创新点:3分
选题指导,项目分享:
缺失字段只有“年龄分段”,“会员城市级别”,“开店时间”。
其中“年龄分段”,“会员城市级别”数据量占比很少,可以去除
“开店时间”缺失达到1/3,暂时保留数据,需要相关分析时再去除。
店铺打分出现负值,考虑到可能是差评,但是常规评分为(0-10),认为0分已经是差评了,具体要看实际业务评定,这里考虑到数量极少,可以视为0分处理
因为月份过少,且4月数据不完整,只分析每日UV(访客数)。
1.在2月上旬属于平台高峰期,且在2月15日出现了最低谷,大概率是京东平台在2月上旬为2月14日情人节准备了预热活动,加上客户为情人节准备礼物的原因。
2.3月27日,3月28两日的UV出现了异常,出现断崖式低峰,而3月29日又立刻恢复了正常,需要重点查明UV低下的原因,暂时分析的原因可能是数据出错或者两日内平台出现技术上的问题,使得用户无法登录。
3.其他日期的数据变化相对较为平缓,属于正常趋势。
日PV(访客量)的变化趋势跟日UV(访客数)的访客变化趋势大致一致,分析一致,不多累述。
性别分布上,该平台无论客户人数还是购买产品数量上的男女比例都是男性占大多数,约比女性多一倍,产品和营销活动可以多以男性为主,但是考虑到部分产品品牌类别原因,如珠宝,化妆品等产品为主的门店仍然应该以女性为主导。
年龄分布上,该数据集年龄分段为3的数据因为异常被删除,在剩下的五个年龄分段中,以5,6年龄分段的人数占大多数,约80%,重点关注这两个年龄段人群进行广告,活动引流,具体代表的年龄需要查看实际业务年龄分段的区间。
2.3.转化率
由于数据行为类别字段中的加入购物车只有4月份的数据,所以这次的转化率是以一周的的数据计算周转化率,
1.绘制各环节的销售漏斗图可以发现,用户从浏览-加入购物车的转换率较低,大部分用户在浏览了商品以后,就直接划走了,并不会加入购物车,浏览到加购的总体转换率只有15.04%,这个数据并不是很客观,原因有可能是商品推荐的并不是用户喜欢的想购买的,或者是用户在浏览了产品后,并不会被商品详情页吸引,因此需要进一步查看从浏览-加入购物车过程中,到底在哪一部分使得用户放弃了加入购物车。
2.绘制各环节转化率的仪表盘,可以发现,加购到购买的转化率还可以,有41.5%,说明加入购物车的客户还是有比较强的购买欲,应该尽量做多活动,新品竞品吸引客户,引导客户加入购物车,提高购买量。
3.总体购买率同样也不高,仅有6.24%,浏览-购买的转换率也不高,因此要优化对用户的推荐,尽量推荐其想要的产品,产品有降价、新品、活动等及时推送给用户,要注重维护平台老用户。加强会员管理等。
因为数据上没有提供商品单价,所以只能分析产品销售数量
产品销售数量和UV,PV,有很大关联,趋势与UV,PV曲线基本一致,都是情人节前出现高峰,产品销售量高,之后慢慢恢复正常趋势。
从时间序列维度进行了销售额的分析,当然也要从产品的维度进行分析了。计算出了每个月销售额top10的产品类别榜单,查看各个产品的每月销售额的变化,哪个月哪个产品是爆款
分析哪些因素能够更有效的提高客户量
模型分析:回归模型可以判断部分字段对提高客户量的有效率,同时能够根据当前数据,门店配置预测出相同时间段的客户量,为相关活动规划提供数据支持。
本次模型的4个系数对应的字段分别是[‘开店时间’,‘店铺打分’,‘粉丝数’,‘会员数’],各系数大小代表对客户量的影响大小,其中多次随机开店时间系数始终为负数,表明开店的时间越大(时间大,门店新),客户量越少,符合正常情况,而会员数的系数始终是最大的,而且占比很大,说明对客户量的影响很大,所以我们更应该在吸引新会员,维护老会员老顾客方面下功夫,多活动多促销,增加用户黏度。
选题指导,项目分享: