数据驱动农业业务变革:从数据架构看生鲜电商的数据价值
目前数据的价值已经从单纯的啤酒尿不湿数据挖掘、决策分析与决策支持、商业分析,往数据资产、生产力资料方向发展。
作为电商垂直领域的生鲜电商则更是数据战场,凭借推荐算法和大数据杀熟等策略,收集完整的定价轨迹和用户偏好,构建全面的用户画像,开展精准的用户运营活动。
对于一个企业而言,从企业架构视角,一个是数据集成的价值,基于数据集成的企业内部IT系统的集成;另一个数据分析的价值,以商业分析、大数据分析、数据建模等为代表的数据运营,且数据运营的方式已经逐步从对内的管理运营,向外扩展形成了对客户对用户对供应商的体系化的运营分析。其中数据集成对应远古时代的SOA体系的ESB和ETL工具,现在则更多地称之为“数据中台”;数据分析(和数据挖掘),对应之前的数据仓库,对应时下的大数据平台。生鲜电商也无外乎这两个方面的数据价值。
一、生鲜电商的数据架构
在阐述生鲜电商的数据架构,先达成如下概念的一致性。基本概念来自百度百科,但最后一句均加上了给大家的我的解释。
- 数据架构:是对企业的主要数据类型、数据来源、逻辑数据资产、物理数据资产、以及数据管理资产的结构及交互的描述
- 数据主题域:通常是联系较为紧密的数据主题的集合。包含很多数据主题,可以根据业务的关注点,将这些数据主题划分到不同的主题域。主题域在数据仓库中较为常见,为分析主题域,可以应对数据集市,主题域由最终用户和数据仓库的设计人员共同完成。可对照之前文章中的业务域和应用域
- 数据主题:是逻辑数据模型的再一次抽象归类,数据主题包含多个概念数据模型。被包含数据主题域中,可参加数据仓库的分析主题。是主题域下数据的再一次细分,一般包括一级主题域和二级主题域。可对应之前文章中的业务能力和应用。详细的数据主题域和数据主题概念内容可以查找企业架构书籍,而非数据仓库书籍。
- 概念数据模型:是面向数据库用户的现实世界的模型,主要用来描述世界的概念化结构,它使数据库的设计人员在设计的初始阶段,摆脱计算机系统及DBMS的具体技术问题,集中精力分析数据以及数据之间的联系等,与具体的数据库管理系统(DBMS)无关。我的解释是概念数据模型就是E-R,为的就是让产品经理(开发人员)与业务方有效沟通数据关系。
- 逻辑数据模型:是一种图形化的展现方式,一般采用面向对象的设计方法,有效组织来源多样的各种业务数据,使用统一的逻辑语言描述业务。
- 物理数据模型:是指提供系统初始设计所需要的基础元素,以及相关元素之间的关系。仅是开发人员(主要是DBA)描述计算机物理世界的数据关系,既数据库表。
首先是生鲜电商的数据主题视图,包括数据主题域和数据主题如下图。有疑问请联系我,这个图还是需要一点数据背景的。
其次是生鲜电商的概念数据模型视图,逻辑数据模型和物理数据模型视图就简单参考之前的IT系统的数据库表结构吧。下图中的概念数据模型的信息化系统,则来自于上上一篇文章《从应用架构看生鲜电商信息化建设》,集成关系有点多一张图放不下就放两张图了。
上图被logo遮住的分别为1:1关系,1:n关系和n:n关系。
这个概念数据对象的集成关系图,包括思考和画图总共花了三个小时,检查了几遍,有些内容已经到了无法自查的地步,因此如果大家发现有违反数据里面第三范式的,请及时留言,助我更正。
将生鲜电商的企业架构串联的文章总计六篇,到此也就分享完了,传输门如下:
《2.3生鲜电商核心业务示例-损耗业务流程详解》(标题不一致)
《2.6从数据架构看生鲜电商的数据价值》(即本文)
后面将介绍农业里面的一些有趣的模式,首先是昆明花卉市场的竞价模式。这些特殊的我圈出来了(如图4所示),想详细了解的可在群里发问,我就不一一文字描述了,用手机备忘录写了快40分钟了,写完这文章了,就不想再手机打字了。数据集成很多内容和传统行业类似。毕竟特殊的逻辑数据模型有(画得时间匆忙,有违反第三范式的,请提示。):
- 竞价:农产品供应商的竞价体系探讨。这是一个有趣的例子。
- 收获:和农事管理系统的数据集成关系。
- 质量:包含供应商供货质量、采购质量、生产加工质量、退货质量要求、打冷质量等。
二、数据分析的价值
对于生鲜电商而言,最有价值的几个数据分析点如下。
对于生鲜电商而言,数据分析的价值如下纬度,很多纬度其实内部还是有重叠的,并不是单一的互斥关系。
1、定价
农产品的价格一直以来就是波动的,振幅还区间较大,可寻规律减少,而现在所谓的农业价格大数据只不过是从几个国家定点的农批市场公开的某一个时刻的价格,再加工农贸市场的价格,以及自己采集员采集的价格。对于真正的电商而言,这些数据都是有限的,失真的。应该生鲜电商需要知道两头的价格。包括批发市场和农贸市场的,一个是成本价,一个是销售价,当然这可能是某个时间段某个批次农产品的价格。现在很多生鲜电商的定价就直接参考农贸市场或竞争对手,却忽略了大家规格、品质的不一致,成本的不一致,企业规模效益的不一致,关联商品组合价格不一致。需要首先多源头采集价格数据,包括产地批发、销地批发、农贸市场、大型商超及生鲜电商竞争对手,然后进行有效关联分析,为商品组合价提供支撑,服务于活动运营。同时不能只管销售,不管采购和产能,采购也可以给出指导价,产能也影响定价。
2、活动运营
一般的互联网公司的数据分析都会对活动啊、用户啊进行运营分析(商业分析),尤其是针对订单达成情况、活动活跃情况、用户活跃情况,一般的电商平台都会做好数据埋点,采集以上数据,用于数据运营,这是个大话题,后续有时间出专文介绍,或者以直播形式进行。
3、用户画像
在这个千人千面概念已经烂大街的当下,不做用户画像,都不好意思说自己是电商,这个和活动运营一样需要埋点和分析,最主要的是需要有模型,一旦没有模型,用户画像也就只是一个摆设的后台管理功能。但是还真有很多电商只做了性别、年龄、地域、消费习惯等纬度的建模,消费习惯还只是自己平台的,这是很不合理的,需要购入更多的外部数据,或者在活动中获取更多的个人信息。对于生鲜电商用户画像模型中。占比较高的应该是职业,家庭地址,消费习惯与结构,年龄,婚姻状况,居住人数,有无小孩,家庭附近生鲜小店情况等。
4、电商推荐
电商推荐算法也是和用户画像一样的电商标配。可以利用用户画像+浏览习惯,建模分析,为不同的用户在不同的场景下,通过千人千面应用,做出不同推荐。
5、供应商管理
供应商管理将带来无限的消费场景。生鲜电商的供应商供应的原材料的品质,是做供应商考核和付款的依据。供应商的区域内寻源,可以货比多家,降低自己的运营成本和风险。根据数据而来的供应商供货资格管理,是作为生鲜大厂的剥削杀手锏。
6、销售指标
销售指标,也是按地区划分的销售大区(很多公司喜欢叫战区,还和军委五大战区对比)、省级公司、市级区域的年月日甚至是小时交易数据的统计和分析,奖励top销售和销售团队,激励甚至末尾淘汰落后的销售和销售团队,将人的潜力最大化,以小部分金钱损失为公司带来更大的利益。这个2B的生鲜电商尤为严重,是真正客户性质的销售。而2C的生鲜地区,这个则是区域运营团队的KPI/OKR。
数据分析的应用场景不仅仅是以上内容,篇幅有限,我就不一一列举了。